Red Hat Training

A Red Hat training course is available for Red Hat OpenStack Platform

1.2. 更新を妨げる可能性のある既知の問題

マイナーバージョンの更新の正常な完了に影響を及ぼす可能性のある、以下の既知の問題を確認してください。

Red Hat Ceph Storage 3 のマイナー 更新により、OSD が破損する可能性がある

Red Hat Ceph Storage 3 は、EL7 で実行されるコンテナー化デプロイメントについては docker に依存します。BZ#1846830 の ceph-ansible 修正により、Ceph コンテナーを制御する systemd ユニットが更新され、systemd ユニットを実行するには docker サービスが稼働している必要があります。この要件は、安全な更新パスを実装して、制御されていない docker パッケージの更新時におけるサービスの中断やデータ破損も回避するのに不可欠です。

ceph-ansible パッケージを更新するだけでは、ceph-ansible 修正の有効化には十分ではありません。また、デプロイメント Playbook を再実行して、コンテナーの systemd ユニットを更新する必要があります。director 主導型の Ceph Storage デプロイメントの問題を解決する方法は、Red Hat ナレッジベースのソリューション Issue affecting minor updates of Red Had Ceph Storage 3 can cause OSDs corruption を参照してください。

OSP13 update may appear to fail while it's eventually successful

openstack overcloud update run コマンドで使用される python tripleo-client は、更新プロセスが完了する前にタイムアウトになる可能性があります。これにより、openstack overcloud update run コマンドが失敗を返し、更新プロセスはバックグラウンドで実行を継続しますが、それが完了するまでバックグラウンドで実行を継続します。

この失敗を回避するには、オーバークラウドノードを更新する前に、tripleo-client/plugin.py ファイルの ttl パラメーターの値を編集して、tripleo-client タイムアウト値を増やします。詳細は、Red Hat ナレッジベースのソリューション OSP 13 update process appears to fail while the update process runs in the background and completes successfully を参照してください。

Slight cut in rabbitmq connectivity triggered a data plane loss after a full sync
RHOSP 13 z10(2019 年 12 月 19 日メンテナーンスリリース) よりも前のリリースから環境を更新する場合は、バグ BZ#1955538 で説明されているデータプレーンの接続損失を回避するため、Red Hat ナレッジベースソリューション Stale namespaces on OSP13 can create data plane cut during update を参照してください。
ceph のアップグレード中、すべての OSD (およびその他の ceph サービス) がダウンする

Ceph を使用している場合には、以下の手順を実施する前に、バグ BZ#1910842 を回避するために Red Hat ナレッジベースのソリューション During minor update of OSP13/RHCS3 to latest packages Ceph services go offline and need to be manually restarted を確認してください。

  • すべてのコントローラーノードの更新
  • 全 HCI コンピュートノードの更新
  • すべての Ceph Storage ノードの更新
z11 アップグレード後の Octavia および LB の問題
更新時に、/var/lib/config-data/puppet-generated/octavia/etc/octavia/conf.d/common/post-deploy.conf という名前のファイルがないため、load-balancing サービス (Octavia) コンテナーが再起動を繰り返します。このファイルは、Amphora のデプロイメント後に octavia サービスを設定するために Red Hat OpenStack Platform 13 のライフサイクル中に導入されました。このファイルは現在、更新の openstack overcloud update converge ステップで生成されます。この問題を回避するには、更新を続行する必要があります。octavia コンテナーは、openstack overcloud update converge コマンドの実行後に通常起動します。現在、Red Hat OpenStack Platform のエンジニアリングチームは、この問題に対する解決策を調査しています。
DBAPIError exception wrapped from (pymysql.err.InternalError) (1054, u"Unknown column 'pool.tls_certificate_id' in 'field list'")

load-balancing サービス (octavia) を使用していて、RHOSP 13 z13 (2020 年 10 月 8 日メンテナーンスリリース) 以前のリリースから更新する場合、バグ BZ#1927169 を回避するために、load-balancing サービスをアップグレードするデータベース移行を正しい順序で実行する必要があります。ブートストラップコントローラーノードを更新しないと、残りのコントロールプレーンを更新することができません。

  1. 現在のメンテナーンスリリースを特定するには、以下のコマンドを実行します。

    $ cat /etc/rhosp-release
  2. ブートストラップコントローラーノードを特定するには、アンダークラウドノードで以下のコマンドを実行します。その際、<any_controller_node_IP_address> は、デプロイメント内のいずれかのコントローラーノードの IP アドレスに置き換えます。

    $ ssh heat-admin@<any_controller_node_IP_address> sudo hiera -c /etc/puppet/hiera.yaml octavia_api_short_bootstrap_node_name
  3. アンダークラウドノードで openstack overcloud update run コマンドを実行し、ブートストラップコントローラーノードを更新します。

    $ openstack overcloud update run --nodes <bootstrap_node_name>
13z16 へのマイナー 更新が "Unable to find constraint" というエラーで失敗する

Red Hat OpenStack Platform 13z16 オーバークラウドノードの更新を再開すると、Unable to find constraint というエラーが発生する場合があります。このエラーは、更新中に RabbitMQ のバージョンが一致しないために発生します。新しい RabbitMQ バージョンを確実に起動できるようにするには、オーバークラウドに存在する可能性があるpacemaker 禁止をクリアする必要があります。

この問題の詳細は、Red Hat ナレッジベースのソリューション Cannot restart Update of the OSP13z16 controllers を参照してください。

コントローラーで ceph-mon を停止できない。エラー: No such container: ceph-mon controller-2

Red Hat Ceph Storage バージョン 3.3 z5 以前を使用し、docker パッケージを docker-1.13.1-209 に更新すると、RHOSP 13 の更新が失敗します。RHOSP 13 の更新では、docker パッケージが更新される前に ceph-mon コンテナーは停止しません。これにより、孤立した ceph-mon プロセスが発生し、新しい ceph-mon コンテナーの開始がブロックされます。

この問題の詳細は、Red Hat ナレッジベースのソリューション Updating Red Hat OpenStack Platform 13.z12 and older with Ceph Storage may fail during controller update を参照してください。