分散コンピュートノードおよびストレージのデプロイメント
Red Hat OpenStack Platform 分散コンピュートノードテクノロジーのデプロイ
OpenStack Documentation Team
rhos-docs@redhat.com
概要
多様性を受け入れるオープンソースの強化
Red Hat では、コード、ドキュメント、Web プロパティーにおける配慮に欠ける用語の置き換えに取り組んでいます。まずは、マスター (master)、スレーブ (slave)、ブラックリスト (blacklist)、ホワイトリスト (whitelist) の 4 つの用語の置き換えから始めます。この取り組みは膨大な作業を要するため、今後の複数のリリースで段階的に用語の置き換えを実施して参ります。詳細は、Red Hat CTO である Chris Wright のメッセージ をご覧ください。
Red Hat ドキュメントへのフィードバック (英語のみ)
Red Hat ドキュメントに対するご意見をお聞かせください。ドキュメントの改善点があればお知らせください。
Jira でドキュメントのフィードバックを提供する
ドキュメントに関するフィードバックを提供するには、Create Issue フォームを使用します。Red Hat OpenStack Platform Jira プロジェクトで Jira Issue が作成され、フィードバックの進行状況を追跡できます。
- Jira にログインしていることを確認してください。Jira アカウントをお持ちでない場合は、アカウントを作成してフィードバックを送信してください。
- Create Issue をクリックして、Create Issue ページを開きます。
- Summary フィールドと Description フィールドに入力します。Description フィールドに、ドキュメントの URL、章またはセクション番号、および問題の詳しい説明を入力します。フォーム内の他のフィールドは変更しないでください。
- Create をクリックします。
第1章 DCN について
Red Hat OpenStack Platform (RHOSP) 16.2 から RHOSP 17.1 へのアップグレードは、分散コンピュートノード (DCN) デプロイメントではサポートされていません。
分散コンピュートノード (DCN) アーキテクチャーは、共通の集中型コントロールプレーンを共有する一方で、リモートコンピュートノードおよびストレージノードをリモートでデプロイできるようにするエッジユースケース向けです。DCN アーキテクチャーでは、パフォーマンスを向上させるために、ワークロードを戦略的に運用上のニーズの近傍に配置することができます。
中央サイトは任意のロールで設定することができますが、最低でも 3 つのコントローラーが必要です。Compute ノードは、中央サイト以外にエッジサイトに設定することができます。
DCN のアーキテクチャーは、ハブとスポークによるルーティング対応ネットワークのデプロイメントです。DCN は、Red Hat OpenStack Platform director を使用した、ルーティング対応プロビジョニングおよびコントロールプレーンネットワーク向けのスパイン/リーフ型デプロイメントと類似しています。
- ハブは、コアルーターおよびデータセンターゲートウェイ (DC-GW) が含まれる中央サイトです。
- スポークはリモートのエッジサイトまたはリーフです。
エッジロケーションにはコントローラーがないため、Red Hat OpenStack Platform の従来のデプロイメントとはアーキテクチャー的に異なります。
- コントロールプレーンサービスは、中央サイトでリモートで実行されます。
- Pacemaker はインストールされません。
- Block Storage サービス (cinder) はアクティブ/アクティブモードで実行されます。
- etcd は分散ロックマネージャー (DLM) としてデプロイされます。
1.1. 分散コンピュートノードのアーキテクチャーに必要なソフトウェア
以下の表は、分散コンピュートノード (DCN) アーキテクチャーに Red Hat OpenStack Platform をデプロイするのに必要なソフトウェアおよび最小バージョンを示しています。
プラットフォーム | バージョン | 任意 |
---|---|---|
Red Hat Enterprise Linux | 8 | いいえ |
Red Hat OpenStack Platform | 16.1 | いいえ |
Red Hat Ceph Storage | 4 | ◯ |
1.2. マルチスタック設計
DCN 設計を使用して Red Hat OpenStack Platform (RHOSP) をデプロイする場合、複数のスタックデプロイメントおよび管理に Red Hat director の機能を使用して、各サイトを個別のスタックとしてデプロイします。
デプロイメントが Red Hat OpenStack Platform 13 からのアップグレードでない限り、DCN アーキテクチャーを単一スタックとして管理する運用はサポートされません。既存のスタックを分割する手法はサポート対象外ですが、既存のデプロイメントにスタックを追加することができます。詳細は、「マルチスタックデプロイメントへの移行」 を参照してください。
中央サイトは RHOSP の従来のスタックデプロイメントですが、Compute ノードまたは Red Hat Ceph ストレージを中央スタックと共にデプロイする必要はありません。
DCN では、それぞれの場所を別のアベイラビリティーゾーン (AZ) としてデプロイします。
1.3. DCN ストレージ
ストレージなしで、またはハイパーコンバージドノード上の Ceph と共に、それぞれのエッジサイトをデプロイすることができます。デプロイするストレージは、デプロイするサイト専用のストレージです。
DCN アーキテクチャーでは、Glance のマルチストアが使用されます。ストレージなしでデプロイされたエッジサイトの場合、追加のツールを利用できるため、イメージを Compute サービス (nova) キャッシュにキャッシュして保存することができます。nova に glance イメージをキャッシュすることで、WAN リンクでイメージをダウンロードするプロセスを回避することで、インスタンスのブート時間が短縮されます。詳細は、10章glance イメージの nova への事前キャッシュ を参照してください。
1.4. DCN エッジ
分散コンピュートノードのアーキテクチャーでは、中央サイトはエッジロケーションを管理するコントロールノードと共にデプロイされます。エッジロケーションをデプロイする場合には、コンピュートノードのみをデプロイし、エッジサイトのアーキテクチャーは Red Hat OpenStack Platform の従来のデプロイメントとは異なります。エッジロケーション:
- コントロールプレーンサービスは、中央サイトでリモートで実行されます。
- Pacemaker は DCN サイトでは実行されません。
- Block Storage サービス (cinder) はアクティブ/アクティブモードで実行されます。
- etcd は分散ロックマネージャー (DLM) としてデプロイされます。
第2章 分散コンピュートノード (DCN) デプロイメントのプランニング
DCN アーキテクチャーを計画する際に、必要なテクノロジーが利用可能で、サポートされていることを確認します。
2.1. DCN アーキテクチャーのストレージに関する考慮事項
現在、DCN アーキテクチャー向けには以下の機能はサポートされていません。
- 分散コンピュートノードのアーキテクチャーでの Red Hat OpenStack Platform 13 から 16 への Fast Forward Upgrade (FFU)
- エッジサイト間でのボリュームスナップショットのコピー。ボリュームからイメージを作成し、glance を使用してイメージをコピーすることで、これに対処することができます。イメージをコピーしたら、そこからボリュームを作成することができます。
- エッジサイトでの Ceph Rados Gateway (RGW)
- エッジサイトでの CephFS
- エッジサイトでのインスタンスの高可用性 (HA)
- サイト間での RBD ミラーリング
-
エッジサイト間、または中央サイトからエッジサイトへの、ライブまたはコールドのインスタンスの移行。サイト境界内でインスタンスを移行することもできます。サイト間でイメージを移動するには、イメージのスナップショットを作成し、
glance image-import
を使用する必要があります。詳細は Confirming image snapshots can be created and copied between sites を確認を参照してください。
さらに、以下の点を考慮する必要があります。
- イメージをエッジサイトにコピーする前に、中央サイトにイメージをアップロードする必要があります。各イメージのコピーは、中央サイトの Image サービス (glance) に存在している必要があります。
- エッジサイトでインスタンスを作成する前に、そのエッジサイトにイメージのローカルコピーが必要です。
- Image、Compute、Block Storage サービスに、RBD ストレージドライバーを使用する必要があります。
- それぞれのサイトで、一意のアベイラビリティーゾーンを割り当て、NovaComputeAvailabilityZone および CinderStorageAvailabilityZone パラメーターに同じ値を使用します。
- エッジサイトからセントラルサイトへ、またはその逆でオフラインのボリュームを移行することができます。エッジサイト間でボリュームを直接移行することはできません。
2.2. DCN アーキテクチャーのネットワークに関する考慮事項
現在、DCN アーキテクチャー向けには以下の機能はサポートされていません。
- Octavia
- DPDK ノード上の DHCP
- TC Flower ハードウェアオフロード向け conntrack
TC Flower ハードウェアオフロード向け conntrack は、テクノロジープレビューとして DCN で利用可能であるため、これらのソリューションを組み合わせて使用した場合、Red Hat では全面的にはサポートしていません。この機能は DCN ではテスト用途にのみ使用すべきで、実稼働環境にデプロイすべきではありません。テクノロジープレビュー機能についての詳しい情報は、対象範囲の詳細を参照してください。
以下の ML2/OVS テクノロジーが完全にサポートされています。
- DPDK ノードでの DHCP を使用しない OVS-DPDK
- SR-IOV
- TC Flower ハードウェアオフロード (conntrack を使用しない)
- Neutron アベイラビリティーゾーン (AZ) とエッジサイトのネットワークノードの組み合わせ (1 サイトにつき 1 AZ)
- ルーティング対応プロバイダーネットワーク
以下の ML2/OVN ネットワークテクノロジーが完全にサポートされます。
- DPDK ノードでの DHCP を使用しない OVS-DPDK
- SR-IOV (DHCP を使用しない)
- TC Flower ハードウェアオフロード (conntrack を使用しない)
- ルーティング対応プロバイダーネットワーク
Neutron AZ がサポートされる OVN GW (ネットワークノード)
重要OVNCMSOptions: 'enable-chassis-as-gw'
を設定し、OVNAvailabilityZone
パラメーターに 1 つ以上の AZ 値を指定して、すべてのルーターゲートウェイポートが必ず OpenStack コントローラーノード上に存在することを確認してください。これらのアクションを実行すると、ルーターはすべてのシャーシをルーターゲートウェイポートの潜在的なホストとしてスケジュールできなくなります。詳細は、ネットワークガイド の ML2/OVN のネットワークサービスのアベイラビリティーゾーンを設定する 参照してください。
さらに、以下の点を考慮する必要があります。
- ネットワークレイテンシー: 許容可能な性能を維持するための、ラウンドトリップタイム (RTT) で測定されるレイテンシーと予想される同時 API 操作の数のバランス。最大 TCP/IP スループットは、RTT と逆比例します。カーネル TCP パラメーターを調整することで、高帯域幅の高レイテンシー接続の問題を軽減できま。クロスサイト通信が 100 ミリ秒を超える場合は Red Hat サポートにお問い合わせください。
- ネットワークドロップアウト: エッジサイトで一時的に中央サイトへのネットワーク接続が失われると、その間は該当するエッジサイトで OpenStack コントロールプレーン API または CLI 操作を実行することができません。たとえば、エッジサイトの Compute ノードは、インスタンスのスナップショットの作成や認証トークンの発行、イメージの削除ができなくなります。この接続喪失の期間中、全般的な OpenStack コントロールプレーン API および CLI 操作は引き続き実施可能で、ネットワーク接続が機能しているその他のエッジサイトへの対応を続けることができます。イメージタイプ: Ceph ストレージと共に DCN アーキテクチャーをデプロイする場合は、raw 形式のイメージを使用する必要があります。
イメージのサイズ:
- オーバークラウドノードのイメージ: オーバークラウドノードのイメージは中央のアンダークラウドノードからダウンロードされます。プロビジョニング時に、これらのイメージの大きなファイルが必要なすべてのネットワークを通じて中央サイトからエッジサイトに転送される可能性があります。
インスタンスのイメージ: エッジサイトにブロックストレージがない場合には、初回使用時に Image サービスのイメージが WAN を通過します。その後のすべての使用のために、イメージは目的のエッジノードにローカルにコピーまたはキャッシュされます。glance イメージにはサイズの制限はありません。転送時間は、利用可能な帯域幅およびネットワークレイテンシーにより変動します。
ブロックストレージがエッジサイトにある場合は、エッジサイトでのブート時間短縮のために、イメージが WAN を通じて非同期にコピーされます。
- プロバイダーネットワーク: これが DCN デプロイメントの推奨ネットワーク設定です。リモートサイトでプロバイダーネットワークを使用する場合は、利用可能なネットワークのアタッチ先に関して、Networking サービス (neutron) が何らかの制約を設けたりチェックを行ったりしない点に注意する必要があります。たとえば、エッジサイト A でしかプロバイダーネットワークを使用しない場合には、エッジサイト B では決してプロバイダーネットワークにアタッチしないようにする必要があります。これは、プロバイダーネットワークを Compute ノードにバインドする際に、プロバイダーネットワークに関するチェックが行われないためです。
- サイト固有のネットワーク: 特定のサイトに固有なネットワークを使用している場合には、DCN のネットワーク設定に制約が生じます。Compute ノードと共に集中 neutron コントローラーをデプロイする場合には、neutron では特定の Compute ノードをリモートノードとして識別するトリガーがありません。したがって、Compute ノードは他の Compute ノードのリストを取得し、自動的にそれぞれのノード間でトンネルを形成します。トンネルは、エッジサイト/エッジサイト間およびエッジサイト/中央サイト間で形成されます。VXLAN または Geneve を使用している場合には、すべてのサイトの全 Compute ノードが、他のすべての Compute ノードおよびコントローラーノードとトンネルを形成します (それらがローカルかリモートかにかかわらず)。すべてのノードで同じ neutron ネットワークを使用していれば、これは問題とはなりません。VLAN を使用している場合の neutron 設定では、すべての Compute ノードが同じブリッジマッピングを持ち、すべての VLAN が各サイトで利用可能でなければなりません。
- 追加のサイト: 中央サイトから追加のリモートサイトに拡張する必要がある場合には、Red Hat OpenStack Platform director で openstack CLI を使用して、新たなネットワークセグメントおよびサブネットを追加することができます。
- エッジサーバーが事前にプロビジョニングされていない場合は、ルーティングされたセグメントにイントロスペクションおよびプロビジョニング用の DHCP リレーを設定する必要があります。
- ルーティングは、クラウド上、または各エッジサイトをハブに接続するネットワークインフラストラクチャー内のいずれかに設定する必要があります。それぞれのサイトについて個別に、各 Red Hat OpenStack Platform クラスターネットワーク (外部、内部 API 等) の L3 サブネットを割り当てるネットワーク設計を実装する必要があります。
2.3. エッジサイトでのストレージトポロジーおよびロール
分散コンピュートノードのアーキテクチャーと共に Red Hat OpenStack Platform をデプロイする場合には、エッジサイトにストレージが必要かどうかを決定する必要があります。ストレージおよびパフォーマンスのニーズに応じて、以下の 3 つの設定の 1 つを使用して各サイトをデプロイできます。すべてのエッジサイトの設定が同一でなければならない訳ではありません。
- ストレージがない DCN
このアーキテクチャーをデプロイするには、
Compute
ロールを使用します。エッジサイトにブロックストレージがない場合:
- コントロールプレーンの Object Storage (swift) サービスが、Image (glance) サービスのバックエンドとして使用されます。
マルチバックエンドのイメージサービスは利用できません。
- イメージはエッジサイトでローカルに Nova でキャッシュされます。詳細は10章glance イメージの nova への事前キャッシュを参照してください。
- インスタンスは、Compute ノード上にローカルに保存されます。
Block Storage (cinder) などのボリュームサービスは、エッジサイトでは利用できません。
重要Red Hat Ceph ストレージを持たない中央サイトをデプロイする場合、後でストレージが設定されたエッジサイトをデプロイするオプションはありません。
エッジサイトでのブロックストレージを持たないデプロイに関する詳細は、「ストレージを持たないエッジノードのデプロイ」を参照してください。
- ストレージを持つ DCN
ストレージを持つ DCN をデプロイするには、Red Hat Ceph Storage を中央サイトにもデプロイする必要があります。
dcn-storage.yaml
およびceph-ansible.yaml
環境ファイルを使用する必要があります。非ハイパーコンバージド Red Hat Ceph Storage ノードが含まれるエッジサイトの場合は、DistributedCompute
、DistributedComputeScaleOut
、CephAll
、およびCephStorage
ロールを使用します。エッジサイトにブロックストレージがある場合:
- Red Hat Ceph Block Devices (RBD) が、Image (glance) サービスのバックエンドとして使用されます。
- マルチバックエンドの Image サービス (glance) が利用できるので、イメージを中央サイトと DCN サイト間でコピーすることができます。
- Block Storage (cinder) サービスはすべてのサイトで利用でき、Red Hat Ceph Block Devices (RBD) ドライバーを使用してアクセスされます。
- Block Storage (cinder) サービスは Compute ノードで実行され、Red Hat Ceph Storage は専用のストレージノードで個別に実行されます。
Nova の一時ストレージは Ceph (RBD) がベースです。
詳細は、「ストレージが設定された中央サイトのデプロイ」 を参照してください。
- ハイパーコンバージドストレージを使用する DCN
この設定をデプロイするには、Red Hat Ceph Storage を中央サイトにもデプロイする必要があります。
dcn-storage.yaml
およびceph-ansible.yaml
環境ファイルを設定する必要があります。DistributedComputeHCI
ロールおよびDistributedComputeHCIScaleOut
ロールを使用します。DistributedComputeScaleOut
ロールを使用して、Red Hat Ceph Storage サービスの提供に関与しない Compute ノードを追加することもできます。エッジサイトにハイパーコンバージドストレージがある場合:
- Red Hat Ceph Block Devices (RBD) が、Image (glance) サービスのバックエンドとして使用されます。
- マルチバックエンドの Image サービス (glance) が利用できるので、イメージを中央サイトと DCN サイト間でコピーすることができます。
- Block Storage (cinder) サービスはすべてのサイトで利用でき、Red Hat Ceph Block Devices (RBD) ドライバーを使用してアクセスされます。
Block Storage サービスおよび Red Hat Ceph Storage はどちらも Compute ノード上で実行されます。
詳細は、「ストレージが設定されたエッジサイトのデプロイ」 を参照してください。
分散コンピュートアーキテクチャーで Red Hat OpenStack Platform をデプロイする場合、それぞれのサイトに固有の設定を指定して、複数のストレージトポロジーをデプロイするオプションがあります。ストレージが設定されたエッジサイトをデプロイするには、Red Hat Ceph ストレージと共に中央サイトをデプロイする必要があります。
2.3.1. エッジデプロイメントのロール
エッジデプロイメントに以下のロールを使用することができます。選択した設定に基づいて、お使いの環境に適切なロールを選択します。
- Compute
-
Compute
ロールは、ストレージのないエッジデプロイメントに使用されます。 - DistributedCompute
-
DistributedCompute
ロールは、ハイパーコンバージドノードなしのストレージデプロイメント用にエッジサイトで使用されます。Image サービスが中央のハブサイトではなくローカルのエッジサイトで使用されるように、DistributedCompute
ロールにはGlanceApiEdge
サービスが含まれます。DistributedCompute
ロールを使用して、最大 3 つのノードをデプロイすることができます。追加のノードには、DistributedComputeScaleOut
ロールを使用します。 - DistributedComputeScaleOut
-
DistributedComputeScaleOut
ロールにはHAproxyEdge
サービスが含まれます。これにより、DistributedComputeScaleOut ロールに作成されたインスタンスが、Image サービスの要求をエッジサイトでそのサービスを提供するノードにプロキシー処理することができます。DistributedCompute
のロールでノードを 3 台デプロイした後に、DistributedComputeScaleOut ロールを使用してコンピュートリソースをスケーリングすることができます。DistrubutedComputeScaleOut
ロールでホストをデプロイする場合、最低限必要なホスト数はありません。このロールは、ハイパーコンバージドノードなしのストレージデプロイメント用にエッジサイトで使用されます。 - DistributedComputeHCI
-
DistributedComputeHCI
ロールは、Ceph Management および OSD サービスを追加することで、エッジサイトでのハイパーコンバージドのデプロイメントを可能にします。DistributedComputeHCI ロールを使用する場合は、必ず 3 台のノードを使用する必要があります。このロールは、完全なコンバージドノードを持つストレージデプロイメント用に使用されます。 - DistributedComputeHCIScaleOut
-
DistributedComputeHCIScaleOut
ロールにはCeph OSD
サービスが含まれます。これにより、エッジサイトにノードがさらに追加される場合に、コンピュートリソースと共にストレージ容量をスケーリングすることができます。このロールには、イメージのダウンロード要求をエッジサイトのGlanceAPIEdge
ノードにリダイレクトするHAproxyEdge
サービスも含まれています。このロールにより、エッジサイトでのハイパーコンバージドのデプロイメントが可能になります。DistributedComputeHCI
ロールを使用する場合は、必ず 3 台のノードを使用する必要があります。このロールは、ハイパーコンバージドノードを持つストレージデプロイメント用にエッジサイトで使用されます。 - CephAll
-
CephAll
ロールには、Ceph OSD、Ceph mon、および Ceph Mgr サービスが含まれます。このロールは、ハイパーコンバージドノードなしのストレージデプロイメント用にエッジサイトで使用されます。CephAll ロールを使用して、最大 3 つのノードをデプロイすることができます。追加のストレージ容量については、CephStorage ロールを使用します。 - CephStorage
-
CephStorage
ロールには Ceph OSD サービスが含まれます。このロールは、ハイパーコンバージドノードなしのストレージデプロイメント用にエッジサイトで使用されます。3 台の CephAll ノードが十分なストレージ容量を提供しない場合は、必要なだけ CephStorage ノードを追加します。
第3章 アンダークラウドでのルーティング対応スパイン/リーフの設定
本項では、コンポーザブルネットワークを使用するルーティング対応のスパイン/リーフを取り入れるための、アンダークラウド設定方法のユースケースについて説明します。
3.1. スパイン/リーフ用のプロビジョニングネットワークの設定
スパイン/リーフインフラストラクチャー用のプロビジョニングネットワークを設定するには、undercloud.conf
ファイルを編集して、以下の手順で説明する該当パラメーターを設定します。
手順
-
アンダークラウドに
stack
ユーザーとしてログインします。 undercloud.conf
ファイルがまだない場合には、サンプルのテンプレートファイルをコピーします。[stack@director ~]$ cp /usr/share/python-tripleoclient/undercloud.conf.sample ~/undercloud.conf
-
undercloud.conf
ファイルを編集します。 [DEFAULT]
セクションに以下の値を設定します。local_ip
をleaf0
上のアンダークラウド IP に設定します。local_ip = 192.168.10.1/24
undercloud_public_host
をアンダークラウドの外部向け IP アドレスに設定します。undercloud_public_host = 10.1.1.1
undercloud_admin_host
をアンダークラウドの管理用 IP アドレスに設定します。この IP アドレスは、通常 leaf0 上にあります。undercloud_admin_host = 192.168.10.2
local_interface
を、ローカルネットワーク用にブリッジを設定するインターフェイスに設定します。local_interface = eth1
enable_routed_networks
をtrue
に設定します。enable_routed_networks = true
subnets
パラメーターを使用してサブネットのリストを定義します。ルーティング対応のスパイン/リーフ内の各 L2 セグメントにサブネットを 1 つ定義します。subnets = leaf0,leaf1,leaf2
local_subnet
パラメーターを使用して、アンダークラウドにローカルな物理 L2 セグメントに関連付けられるサブネットを指定します。local_subnet = leaf0
undercloud_nameservers
の値を設定します。undercloud_nameservers = 10.11.5.19,10.11.5.20
ヒントアンダークラウドのネームサーバーに使用する DNS サーバーの現在の IP アドレスは、/etc/resolv.conf を参照して確認することができます。
subnets
パラメーターで定義するサブネットごとに、新規セクションを作成します。[leaf0] cidr = 192.168.10.0/24 dhcp_start = 192.168.10.10 dhcp_end = 192.168.10.90 inspection_iprange = 192.168.10.100,192.168.10.190 gateway = 192.168.10.1 masquerade = False [leaf1] cidr = 192.168.11.0/24 dhcp_start = 192.168.11.10 dhcp_end = 192.168.11.90 inspection_iprange = 192.168.11.100,192.168.11.190 gateway = 192.168.11.1 masquerade = False [leaf2] cidr = 192.168.12.0/24 dhcp_start = 192.168.12.10 dhcp_end = 192.168.12.90 inspection_iprange = 192.168.12.100,192.168.12.190 gateway = 192.168.12.1 masquerade = False
-
undercloud.conf
ファイルを保存します。 アンダークラウドをインストールするコマンドを実行します。
[stack@director ~]$ openstack undercloud install
この設定により、プロビジョニングネットワークまたはコントロールプレーン上に 3 つのサブネットが作成されます。オーバークラウドは、各ネットワークを使用して対応する各リーフ内にシステムをプロビジョニングします。
アンダークラウドへの DHCP 要求が適切にリレーされるようにするには、DHCP リレーを設定する必要がある場合があります。
3.2. DHCP リレーの設定
DHCP リレーサービスは、リクエストを転送したいリモートネットワークセグメントに接続されているスイッチ、ルーター、またはサーバーで実行します。
アンダークラウド上で DHCP リレーサービスを実行しないでください。
アンダークラウドは、プロビジョニングネットワーク上の 2 つの DHCP サーバーを使用します。
- イントロスペクション DHCP サーバー。
- プロビジョニング DHCP サーバー。
DHCP リレーは、アンダークラウド上の両方の DHCP サーバーに DHCP リクエストを転送するように設定する必要があります。
UDP ブロードキャストに対応するデバイスで UDP ブロードキャストを使用して、アンダークラウドのプロビジョニングネットワークが接続されている L2 ネットワークセグメントに DHCP 要求をリレーすることができます。または、DHCP 要求を特定の IP アドレスにリレーする UDP ユニキャストを使用することができます。
特定のデバイス種別での DHCP リレーの設定は、本書の対象外となっています。本ガイドでは参考として、ISC DHCP ソフトウェアの実装を使用した DHCP リレー設定の例を説明します。詳細は、dhcrelay(8) の man ページを参照してください。
DHCP オプション 79 は、一部のリレー、特に DHCPv6 アドレスを提供するリレー、および元の MAC アドレスを渡さないリレーに必要です。詳細は、RFC6939 を参照してください。
ブロードキャスト DHCP リレー
この方法では、UDP ブロードキャストトラフィックを使用して DHCP 要求を、DHCP サーバーが存在する L2 ネットワークセグメントにリレーします。ネットワークセグメント上のすべてのデバイスがブロードキャストトラフィックを受信します。UDP ブロードキャストを使用する場合は、アンダークラウド上の両方の DHCP サーバーがリレーされた DHCP 要求を受信します。実装に応じて、インターフェイスまたは IP ネットワークアドレスを指定して設定できます。
- インターフェイス
- DHCP 要求がリレーされる L2 ネットワークセグメントに接続されるインターフェイスを指定します。
- IP ネットワークアドレス
- DHCP 要求がリレーされる IP ネットワークのネットワークアドレスを指定します。
ユニキャスト DHCP リレー
この方法では、UDP ユニキャストトラフィックを使用して DHCP 要求を特定の DHCP サーバーにリレーします。UDP ユニキャストを使用する場合には、DHCP リレーを提供するデバイスが、アンダークラウド上のイントロスペクション用に使用されるインターフェイスに割り当てられた IP アドレスと、ctlplane
ネットワーク用の DHCP サービスをホストするために OpenStack Networking (neutron) サービスが作成するネットワーク名前空間の IP アドレスの両方に対して、DHCP 要求をリレーするように設定する必要があります。
イントロスペクションに使用されるインターフェイスは、undercloud.conf
ファイルで inspection_interface
として定義されるインターフェイスです。このパラメーターを設定していない場合には、アンダークラウドのデフォルトインターフェイスは br-ctlplane
になります。
br-ctlplane
インターフェイスをイントロスペクションに使用するのは一般的です。undercloud.conf
ファイルで local_ip
として定義する IP アドレスは、br-ctlplane
インターフェイス上にあります。
Neutron DHCP 名前空間に確保される IP アドレスは、undercloud.conf
ファイルの local_subnet
で設定する IP 範囲内で利用可能な最初のアドレスです。IP 範囲内の最初のアドレスは、設定の dhcp_start
で定義するアドレスです。たとえば、以下の設定を使用する場合、192.168.10.10
がその IP アドレスになります。
[DEFAULT] local_subnet = leaf0 subnets = leaf0,leaf1,leaf2 [leaf0] cidr = 192.168.10.0/24 dhcp_start = 192.168.10.10 dhcp_end = 192.168.10.90 inspection_iprange = 192.168.10.100,192.168.10.190 gateway = 192.168.10.1 masquerade = False
DHCP 名前空間の IP アドレスは自動的に割り当てられます。多くの場合、これは IP 範囲の最初のアドレスになります。これを確認するには、アンダークラウドで以下のコマンドを実行します。
$ openstack port list --device-owner network:dhcp -c "Fixed IP Addresses" +----------------------------------------------------------------------------+ | Fixed IP Addresses | +----------------------------------------------------------------------------+ | ip_address='192.168.10.10', subnet_id='7526fbe3-f52a-4b39-a828-ec59f4ed12b2' | +----------------------------------------------------------------------------+ $ openstack subnet show 7526fbe3-f52a-4b39-a828-ec59f4ed12b2 -c name +-------+--------+ | Field | Value | +-------+--------+ | name | leaf0 | +-------+--------+
dhcrelay
の設定例
以下の例では、dhcp
パッケージの dhcrelay
コマンドは以下の設定を使用します。
-
DHCP の受信要求をリレーするインターフェイスは
eth1
、eth2
、eth3
です。 -
ネットワークセグメント上のアンダークラウドの DHCP サーバーが接続されているインターフェイスは
eth0
です。 -
イントロスペクションに使用される DHCP サーバーがリッスンしている IP アドレスは
192.168.10.1
です。 -
プロビジョニングに使用される DHCP サーバーがリッスンしている IP アドレスは
192.168.10.10
です。
これで、dhcrelay
コマンドは以下のようになります。
dhcrelay
バージョン 4.2.x:$ sudo dhcrelay -d --no-pid 192.168.10.10 192.168.10.1 \ -i eth0 -i eth1 -i eth2 -i eth3
dhcrelay
バージョン 4.3.x 以降:$ sudo dhcrelay -d --no-pid 192.168.10.10 192.168.10.1 \ -iu eth0 -id eth1 -id eth2 -id eth3
Cisco IOS ルーティングスイッチの設定例
この例では、次のタスクを実行するために、以下に示す Cisco IOS 設定を使用しています。
- プロビジョニングネットワークに使用する VLAN を設定する。
- リーフの IP アドレスを追加する。
-
IP アドレス
192.168.10.1
をリッスンするイントロスペクション用 DHCP サーバーに、UDP および BOOTP 要求を転送する。 -
IP アドレス
192.168.10.10
をリッスンするプロビジョニング用 DHCP サーバーに、UDP および BOOTP 要求を転送する。
interface vlan 2 ip address 192.168.24.254 255.255.255.0 ip helper-address 192.168.10.1 ip helper-address 192.168.10.10 !
これでプロビジョニングネットワークの設定が完了したので、残りのオーバークラウドリーフネットワークを設定することができます。
3.3. リーフネットワーク向けのフレーバーの作成とノードのタグ付け
各リーフネットワークのそれぞれのロールには、フレーバーとロールの割り当てが必要です。これにより、ノードを対応するリーフにタグ付けすることができます。各フレーバーを作成してロールに割り当てるには、以下の手順を実施します。
手順
stackrc
ファイルを取得します。[stack@director ~]$ source ~/stackrc
各カスタムロール用のフレーバーを作成します。
$ ROLES="control compute_leaf0 compute_leaf1 compute_leaf2 ceph-storage_leaf0 ceph-storage_leaf1 ceph-storage_leaf2" $ for ROLE in $ROLES; do openstack flavor create --id auto --ram <ram_size_mb> --disk <disk_size_gb> --vcpus <no_vcpus> $ROLE ; done $ for ROLE in $ROLES; do openstack flavor set --property "cpu_arch"="x86_64" --property "capabilities:boot_option"="local" --property resources:DISK_GB='0' --property resources:MEMORY_MB='0' --property resources:VCPU='0' $ROLE ; done
-
<ram_size_mb>
をベアメタルノードの RAM (MB 単位) に置き換えます。 -
<disk_size_gb>
をベアメタルノード上のディスク容量 (GB 単位) に置き換えます。 -
<no_vcpus>
をベアメタルノードの CPU 数に置き換えます。
-
ノードリストを取得して UUID を把握します。
(undercloud)$ openstack baremetal node list
カスタムリソースクラスを使用して、各ベアメタルノードをリーフネットワークおよびロールにタグ付けします。
(undercloud)$ openstack baremetal node set \ --resource-class baremetal.LEAF-ROLE <node>
<node>
をベアメタルノードの ID に置き換えてください。たとえば、以下のコマンドを実行して、UUID
58c3d07e-24f2-48a7-bbb6-6843f0e8ee13
のノードを Leaf2 上の Compute ロールにタグ付けします。(undercloud)$ openstack baremetal node set \ --resource-class baremetal.COMPUTE-LEAF2 58c3d07e-24f2-48a7-bbb6-6843f0e8ee13
各リーフネットワークロールフレーバーをカスタムリソースクラスに関連付けます。
(undercloud)$ openstack flavor set \ --property resources:CUSTOM_BAREMETAL_LEAF_ROLE=1 \ <custom_role>
Bare Metal Provisioning サービスノードのリソースクラスに対応するカスタムリソースクラスの名前を指定するには、リソースクラスを大文字に変換し、それぞれの句読点をアンダースコアに置き換え、
CUSTOM_
の接頭辞を追加します。注記フレーバーが要求できるのは、ベアメタルリソースクラスの 1 つのインスタンスだけです。
node-info.yaml
ファイルで、各カスタムリーフロールに使用するフレーバーおよび各カスタムリーフロールに割り当てるノード数を指定します。たとえば、以下の設定では、使用するフレーバーと、カスタムのリーフロールcompute_leaf0
、compute_leaf1
、compute_leaf2
、ceph-storage_leaf0
、ceph-storage_leaf1
、およびceph-storage_leaf2
に割り当てるノード数を指定します。parameter_defaults: OvercloudControllerFlavor: control OvercloudComputeLeaf0Flavor: compute_leaf0 OvercloudComputeLeaf1Flavor: compute_leaf1 OvercloudComputeLeaf2Flavor: compute_leaf2 OvercloudCephStorageLeaf0Flavor: ceph-storage_leaf0 OvercloudCephStorageLeaf1Flavor: ceph-storage_leaf1 OvercloudCephStorageLeaf2Flavor: ceph-storage_leaf2 ControllerLeaf0Count: 3 ComputeLeaf0Count: 3 ComputeLeaf1Count: 3 ComputeLeaf2Count: 3 CephStorageLeaf0Count: 3 CephStorageLeaf1Count: 3 CephStorageLeaf2Count: 3
3.4. ベアメタルノードのポートからコントロールプレーンのネットワークセグメントへのマッピング
L3 ルーティング対応のネットワーク上でのデプロイメントを有効にするには、ベアメタルポートの physical_network
フィールドを設定する必要があります。各ベアメタルポートは、OpenStack Bare Metal (ironic) サービス内のベアメタルノードに関連付けられます。物理ネットワーク名は、アンダークラウドの設定の subnets
オプションで指定する名前です。
undercloud.conf
ファイルの local_subnet
で指定されるサブネットの物理ネットワーク名には、必ず ctlplane
という名前が付けられます。
手順
stackrc
ファイルを取得します。$ source ~/stackrc
ベアメタルノードをチェックします。
$ openstack baremetal node list
ベアメタルノードは
enroll
またはmanageable
の状態であることを確認してください。ベアメタルノードがこれらのいずれかの状態にない場合、ベアメタルポートでphysical_network
プロパティーを設定するコマンドは失敗します。全ノードをmanageable
の状態に設定するには、以下のコマンドを実行します。$ for node in $(openstack baremetal node list -f value -c Name); do openstack baremetal node manage $node --wait; done
ベアメタルポートとベアメタルノードの関連付けを確認します。
$ openstack baremetal port list --node <node-uuid>
ポートの
physical-network
パラメーターを設定します。以下の例では、leaf0
、leaf1
、およびleaf2
の 3 つのサブネットが設定で定義されています。local_subnet はleaf0
です。local_subnet
の物理ネットワークは常にctlplane
であるため、leaf0
に接続されたベアメタルポートは必ず ctlplane を使用します。残りのポートは他のリーフ名を使用します。$ openstack baremetal port set --physical-network ctlplane <port-uuid> $ openstack baremetal port set --physical-network leaf1 <port-uuid> $ openstack baremetal port set --physical-network leaf2 <port-uuid>
オーバークラウドをデプロイする前に、ノードをイントロスペクションします。
--all-manageable
オプションと-provide
オプションを付けて、デプロイ可能なノードとして設定します。$ openstack overcloud node introspect --all-manageable --provide
3.5. スパイン/リーフ型のプロビジョニングネットワークへの新規リーフの追加
新しい物理サイトの追加など、ネットワーク容量を増やす場合には、新しいリーフと、対応するサブネットを Red Hat OpenStack Platform のスパイン/リーフ型のプロビジョニングネットワークに追加する必要がある場合があります。オーバークラウドでリーフをプロビジョニングする場合には、対応するアンダークラウドのリーフが使用されます。
前提条件
- RHOSP デプロイメントでスパイン/リーフ型ネットワークトポロジーが使用されている。
手順
- アンダークラウドホストに stack ユーザーとしてログインします。
source コマンドでアンダークラウドの認証情報ファイルを読み込みます。
$ source ~/stackrc
/home/stack/undercloud.conf
ファイルで、以下の手順を実施します。subnets
パラメーターを特定し、追加するリーフ用の新規サブネットを追加します。サブネットは、ルーティング対応のスパイン/リーフ内の L2 セグメントを表します。
例
以下の例では、新しいリーフ (
leaf3
) に新規サブネット (leaf3
) が追加されます。subnets = leaf0,leaf1,leaf2,leaf3
追加したサブネットのセクションを作成します。
例
以下の例では、新しいサブネット (
leaf3
に[leaf3]
セクションが追加されます。[leaf0] cidr = 192.168.10.0/24 dhcp_start = 192.168.10.10 dhcp_end = 192.168.10.90 inspection_iprange = 192.168.10.100,192.168.10.190 gateway = 192.168.10.1 masquerade = False [leaf1] cidr = 192.168.11.0/24 dhcp_start = 192.168.11.10 dhcp_end = 192.168.11.90 inspection_iprange = 192.168.11.100,192.168.11.190 gateway = 192.168.11.1 masquerade = False [leaf2] cidr = 192.168.12.0/24 dhcp_start = 192.168.12.10 dhcp_end = 192.168.12.90 inspection_iprange = 192.168.12.100,192.168.12.190 gateway = 192.168.12.1 masquerade = False [leaf3] cidr = 192.168.13.0/24 dhcp_start = 192.168.13.10 dhcp_end = 192.168.13.90 inspection_iprange = 192.168.13.100,192.168.13.190 gateway = 192.168.13.1 masquerade = False
-
undercloud.conf
ファイルを保存します。 アンダークラウドを再インストールします。
$ openstack undercloud install
第4章 DCN デプロイメント用オーバークラウドテンプレートの準備
4.1. 個別の heat スタックを使用するための前提条件
個別の heat スタックを使用してデプロイメントを作成するためには、お使いの環境が以下の前提条件を満たす必要があります。
- 稼働状態にある Red Hat OpenStack Platform 16 アンダークラウド
- Ceph Storage ユーザー: Red Hat Ceph Storage 4 へのアクセス
- 中央サイト: 中央コントローラーノードとしての機能を持つ 3 台のノード。3 台のコントローラーノードは、すべて同じ heat スタック内になければなりません。コントローラーノードまたはいずれかのコントロールプレーンサービスを異なる heat スタックに分割することはできません。
- エッジサイトに Ceph ストレージをデプロイする場合、中央サイトでは Ceph ストレージが要件となります。
- それぞれの追加 DCN サイト: 3 台の HCI Compute ノード
- すべてノードは事前にプロビジョニングされているか、中央のデプロイメントネットワークから PXE ブートできる必要があります。DHCP リレーを使用して、DCN 向けのこの接続を有効にすることができます。
- すべてのノードが ironic によってイントロスペクションされている。
-
Red Hat では、<role>HostnameFormat パラメーターをデフォルト値 %stackname%-<role>-%index% のままにすることを推奨します。%stackname% の接頭辞を含めないと、オーバークラウドは別のスタックの分散コンピュートノードに同じホスト名を使用します。分散コンピュートノードが %stackname% の接頭辞を使用して、別のエッジサイトのノードと区別できるようにします。たとえば、
dcn0
とdcn1
という名前の 2 つのエッジサイトをデプロイする場合、スタック名の接頭辞は、アンダークラウドでopenstack server list
コマンドを実行する際に dcn0-distributedcompute-0 と dcn1-distributedcompute-0 を区別するのに役立ちます。 -
source コマンドで
centralrc
認証ファイルを読み込み、エッジサイトおよび中央サイトでワークロードをスケジュールします。エッジサイト用に自動的に生成される認証ファイルは必要ありません。
4.2. 個別 heat スタックのデプロイメント例の制限
本セクションでは、Red Hat OpenStack Platform 上で個別の heat スタックを使用するデプロイメントの例について説明します。この環境の例には、以下の制限があります。
- スパイン/リーフ型ネットワーク: 本セクションの例は、分散コンピュートノード (DCN) デプロイメントで必要となるルーティング要件を示していません。
- Ironic DHCP リレー: 本セクションには、DHCP リレーと共に Ironic を設定する方法は含まれません。
4.3. 個別 heat スタックのデプロイメントの設計
個別の heat スタック内でデプロイメントを分割するには、まずコントロールプレーンと共に単一のオーバークラウドをデプロイする必要があります。その後、分散コンピュートノード (DCN) サイト向けに個別のスタックを作成することができます。以下の例は、異なるノード種別の個別スタックを示しています。
-
コントローラーノード:
central
(例) という名前の個別 heat スタックにより、コントローラーをデプロイします。DCN サイト向けの新規 heat スタックを作成する場合は、central
スタックからのデータを使用してスタックを作成する必要があります。コントローラーノードは、あらゆるインスタンス管理タスクに利用できなければなりません。 -
DCN サイト:
dcn0
、dcn1
など一意の名前が付けられた個別の heat スタックを設定することができます。DHCP リレーを使用して、プロビジョニングネットワークをリモートサイトに拡張します。
それぞれのスタック用に個別のアベイラビリティーゾーン (AZ) を作成する必要があります。
スパイン/リーフ型ネットワークを使用する場合は、特定の形式を使用して Storage
および StorageMgmt
ネットワークを定義する必要があります。これにより、ceph-ansible はそれらのネットワークを使用するように Ceph を正しく設定することができます。Storage
および StorageMgmt
ネットワークをオーバーライド値として定義し、値を一重引用符で囲みます。以下の例では、ストレージネットワーク (public_network
) はコンマで区切られた 2 つのサブネットにまたがり、一重引用符で囲まれています。
CephAnsibleExtraConfig: public_network: '172.23.1.0/24,172.23.2.0/24'
4.4. 複数スタックでのネットワークリソースの再利用
複数のスタックが同じネットワークリソース (仮想 IP アドレスやサブネット等) を使用するように設定することができます。ManageNetworks
設定または external_resource_*
フィールドのいずれかを使用して、スタック間でネットワークリソースを複製することができます。
external_resource_*
フィールドを使用している場合は、ManageNetworks
設定を使用しないでください。
スタック間でネットワークを再利用しない場合は、network_data.yaml
で定義される各ネットワークには、デプロイされるすべてのスタックに渡って一意の名前を指定する必要があります。たとえば、スタック間でネットワークを共有する意図がない限り、ネットワーク名 internal_api
をスタック間で再利用することはできません。ネットワークに異なる名前および name_lower
属性 (例: InternalApiCompute0
および internal_api_compute_0
) を設定します。
4.5. ManageNetworks を使用したネットワークリソースの再利用
ManageNetworks
設定を使用すると、複数のスタックで同じ network_data.yaml
ファイルを使用することができ、設定はグローバルにすべてのネットワークリソースに適用されます。network_data.yaml
ファイルは、スタックが使用するネットワークリソースを定義します。
- name: StorageBackup vip: true name_lower: storage_backup ip_subnet: '172.21.1.0/24' allocation_pools: [{'start': '171.21.1.4', 'end': '172.21.1.250'}] gateway_ip: '172.21.1.1'
ManageNetworks を false に設定すると、ノードはすでに central
スタックに作成されている既存のネットワークを使用します。
新規スタックが既存のネットワークリソースを管理しないように、以下のシーケンスを使用します。
手順
-
ManageNetworks: true
と設定するか未設定のままにして、中央スタックをデプロイします。 -
ManageNetworks: false
の設定で、追加のスタックをデプロイします。
新規ネットワークリソースを追加する場合、たとえばスパイン/リーフ型デプロイメントに新しいリーフを追加する場合は、新たな network_data.yaml
で中央スタックを更新する必要があります。これは、中央スタックが引き続きネットワークリソースを所有および管理するためです。中央スタックでネットワークリソースが利用可能になったら、それらを使用するように追加のスタックをデプロイすることができます。
4.6. UUID を使用したネットワークリソースの再利用
スタック間でのネットワークの再利用をより厳密に制御する必要がある場合は、network_data.yaml
ファイルでリソース (ネットワーク、サブネット、セグメント、仮想 IP 等) の external_resource_*
フィールドを使用することができます。これらのリソースは外部管理と識別され、heat はそれらのリソースに関する作成、更新、または削除を一切行いません。
network_data.yaml
ファイルに、必要な各ネットワーク定義のエントリーを追加します。これで、リソースを別のスタックでのデプロイメントに利用できるようになります。
external_resource_network_id: Existing Network UUID external_resource_subnet_id: Existing Subnet UUID external_resource_segment_id: Existing Segment UUID external_resource_vip_id: Existing VIP UUID
以下の例では、コントロールプレーンスタックからの internal_api
ネットワークを別のスタックで再利用します。
手順
関連するネットワークリソースの UUID を把握します。
$ openstack network show internal_api -c id -f value $ openstack subnet show internal_api_subnet -c id -f value $ openstack port show internal_api_virtual_ip -c id -f value
上記のコマンドの出力に表示される値を保存し、それらを別のスタックの
network_data.yaml
ファイルのinternal_api
ネットワークのネットワーク定義に追加します。- name: InternalApi external_resource_network_id: 93861871-7814-4dbc-9e6c-7f51496b43af external_resource_subnet_id: c85c8670-51c1-4b17-a580-1cfb4344de27 external_resource_vip_id: 8bb9d96f-72bf-4964-a05c-5d3fed203eb7 name_lower: internal_api vip: true ip_subnet: '172.16.2.0/24' allocation_pools: [{'start': '172.16.2.4', 'end': '172.16.2.250'}] ipv6_subnet: 'fd00:fd00:fd00:2000::/64' ipv6_allocation_pools: [{'start': 'fd00:fd00:fd00:2000::10', 'end': 'fd00:fd00:fd00:2000:ffff:ffff:ffff:fffe'}] mtu: 1400
4.7. 個別の heat スタックの管理
本セクションの手順では、3 つの heat スタック (central
、dcn0
、および dcn1
) 用の環境ファイルを取りまとめる方法について説明します。Red Hat では、各デプロイメントに関する情報を個別に維持するために、各 heat スタックのテンプレートを個別のディレクトリーに保管することを推奨します。
手順
central
heat スタックを定義します。$ mkdir central $ touch central/overrides.yaml
central
heat スタックから、データを全 DCN サイト用の共通ディレクトリーに抽出します。$ mkdir dcn-common $ touch dcn-common/overrides.yaml $ touch dcn-common/central-export.yaml
central-export.yaml
ファイルは、後でopenstack overcloud export
コマンドで作成されます。本セクションで説明するすべての DCN デプロイメントがこのファイルを使用する必要があるため、このファイルはdcn-common
ディレクトリー内に作成されます。dcn0
サイトを定義します。$ mkdir dcn0 $ touch dcn0/overrides.yaml
さらに DCN サイトをデプロイするには、数字を増やして追加の dcn
ディレクトリーを作成します。
ファイル設定の例を示すために、touch コマンドを使用しています。デプロイメントに成功するためには、それぞれのファイルに適切なコンテンツが含まれている必要があります。
4.8. コンテナーイメージの取得
個別の heat スタックによるデプロイメントに必要なコンテナーイメージを取得するには、以下の手順およびサンプルファイルのコンテンツを使用ます。エッジサイトの環境ファイルを指定して openstack container image prepare
コマンドを実行し、オプションまたはエッジサイト固有のサービスのコンテナーイメージが含まれるようにする必要があります。
詳細は、Preparing container images を参照してください。
手順
containers.yaml
にレジストリーサービスアカウントの認証情報を追加します。parameter_defaults: ContainerImagePrepare: - push_destination: true set: ceph_namespace: registry.redhat.io/rhceph ceph_image: rhceph-4-rhel8 ceph_tag: latest name_prefix: openstack- namespace: registry.redhat.io/rhosp16-rhel8 tag: latest ContainerImageRegistryCredentials: # https://access.redhat.com/RegistryAuthentication registry.redhat.io: registry-service-account-username: registry-service-account-password
images-env.yaml
として環境ファイルを生成します。sudo openstack tripleo container image prepare \ -e containers.yaml \ --output-env-file images-env.yaml
作成される
images-env.yaml
ファイルは、ファイルを生成したスタックのデプロイメント手順の一部として追加されます。
4.9. エッジサイト用の高速データパスロールの作成
エッジサイトで高速データパスサービスを使用するには、高速データパスとエッジサービスの両方を定義するカスタムロールを作成する必要があります。デプロイメントのロールファイルを作成する場合には、分散コンピュートノードアーキテクチャーおよび DPDK や SR-IOV 等の高速データパスサービスの両方に必要なサービスを定義する新たに作成されるロールを含めることができます。
以下の例では、DPDK と distributedCompute のカスタムロールを作成します。
前提条件
アンダークラウドの正常なインストール。詳しくは、Installing the undercloud を参照してください。
手順
-
アンダークラウドホストに
stack
ユーザーとしてログインします。 デフォルトの
roles
ディレクトリーをコピーします。cp -r /usr/share/openstack-tripleo-heat-templates/roles ~/.
DistributedCompute.yaml
ファイルからDistributedComputeDpdk.yaml
という新しいファイルを作成します。cp roles/DistributedCompute.yaml roles/DistributedComputeDpdk.yaml
DPDK サービスを新しい
DistributedComputeDpdk.yaml
ファイルに追加します。DistributedComputeDpdk.yaml
ファイルにないパラメーターをComputeOvsDpdk.yaml
ファイルで特定することで、追加が必要なパラメーターを特定できます。diff -u roles/DistributedComputeDpdk.yaml roles/ComputeOvsDpdk.yaml
この出力では、
+
で始まるパラメーターは ComputeOvsDpdk.yaml ファイルに存在しますが、DistributedComputeDpdk.yaml ファイルにはありません。これらのパラメーターを新しいDistributedComputeDpdk.yaml
ファイルに追加します。DistributedComputeDpdk.yaml
を使用して、DistributedComputeDpdk
ロールファイルを作成します。openstack overcloud roles generate --roles-path ~/roles/ -o ~/roles/roles-custom.yaml DistributedComputeDpdk
これと同じ手法を使用して、要件を満たすように、エッジの SR-IOV または SR-IOV と DPDK の組み合わせ用に、高速データパスロールを作成することができます。
関連情報
ブロックストレージを持たないエッジサイトをデプロイする場合は、以下を参照してください。
Red Hat Ceph Storage と共にエッジサイトをデプロイする場合は、以下を参照してください。
第5章 中央サイトのインストール
分散コンピュートノード (DCN) アーキテクチャーに中央サイトをデプロイする場合、クラスターをデプロイすることができます。
- Compute ノードあり/なし
- Red Hat Ceph Storage あり/なし
中央サイトに Red Hat Ceph Storage を設定せずに Red Hat OpenStack Platform をデプロイする場合は、どのエッジサイトにも Red Hat Ceph Storage をデプロイすることはできません。また、後で再デプロイして Red Hat Ceph Storage を中央サイトに追加するオプションはありません。
5.1. エッジストレージを持たない中央コントローラーのデプロイ
中央サイトで Image サービス (glance) のバックエンドとして Object Storage サービス (swift) を使用する場合は、エッジサイトにブロックストレージを持たない分散コンピュートノードクラスターをデプロイすることができます。各アーキテクチャーのロールおよびネットワークプロファイルが異なるため、ブロックストレージを設定せずにデプロイされたサイトは、後でブロックストレージを持つように更新することはできません。
重要: 以下の手順では Cinder のバックエンドとして lvm を使用していますが、実稼働環境用ではサポートされません。Cinder のバックエンドとして、認定されたブロックストレージソリューションをデプロイする必要があります。
一般的なオーバークラウドデプロイメントと同様に、中央コントローラークラスターをデプロイします。このクラスターには Compute ノードは必要ありません。したがって、Compute ノード数を 0
に設定し、デフォルトの 1
をオーバーライドすることができます。中央コントローラーには、ストレージおよび Oslo 設定に関して特定の要件があります。これらの要件を満たすには、以下の手順を使用します。
手順
以下の手順で、中央サイトの初回デプロイメント手順の概要を説明します。
glance マルチストアを持たない DCN デプロイメントの例について、デプロイメントコマンドおよび環境ファイルを以下の手順で詳しく説明します。以下の手順には、ここでの目的とは関連しないが実際の設定には必要な要素 (ネットワーク設定など) は含まれていません。
ホームディレクトリーに、デプロイする各スタックのディレクトリーを作成します。
mkdir /home/stack/central mkdir /home/stack/dcn0 mkdir /home/stack/dcn1
以下のような設定で
central/overrides.yaml
という名前のファイルを作成します。parameter_defaults: NtpServer: - 0.pool.ntp.org - 1.pool.ntp.org ControllerCount: 3 ComputeCount: 0 OvercloudControllerFlavor: baremetal OvercloudComputeFlavor: baremetal ControllerSchedulerHints: 'capabilities:node': '0-controller-%index%' GlanceBackend: swift
-
ControllerCount: 3
: ノードを 3 台デプロイすることを指定します。これらのノードは、glance 用に swift を、cinder 用に lvm をそれぞれ使用し、エッジコンピュートノード用に control-plane サービスをホストします。 -
ComputeCount: 0
: オプションのパラメーターで、Compute ノードが中央コントローラーノードと共にデプロイされないようにします。 GlanceBackend: swift
: Image サービス (glance) のバックエンドとして Object Storage (swift) を使用することを指定します。この設定は、分散コンピュートノード (DCN) と以下のように連携します。
DCN 上の Image サービスは、中央の Object Storage バックエンドから受けとるイメージのキャッシュコピーを作成します。Image サービスは、HTTP を使用して Object Storage からのイメージをローカルディスクキャッシュにコピーします。
注記中央のコントローラーノードは、分散コンピュートノード (DCN) サイトに接続できる必要があります。中央のコントローラーノードは、ルーティング対応のレイヤー 3 接続を使用することができます。
-
実際の環境に適したロールを使用して、中央サイト用のロールを生成します。
openstack overcloud roles generate Controller \ -o ~/central/control_plane_roles.yaml
環境ファイル
~/central/central-images-env.yaml
を生成します。sudo openstack tripleo container image prepare \ -e containers.yaml \ --output-env-file ~/central/central-images-env.yaml
site-name.yaml
環境ファイルでサイトの命名規則を設定します。Nova アベイラビリティーゾーンと Cinder ストレージアベイラビリティーゾーンが一致している必要があります。cat > /home/stack/central/site-name.yaml << EOF parameter_defaults: NovaComputeAvailabilityZone: central ControllerExtraConfig: nova::availability_zone::default_schedule_zone: central NovaCrossAZAttach: false CinderStorageAvailabilityZone: central EOF
中央コントローラーノードをデプロイします。たとえば、以下の内容の
deploy.sh
ファイルを使用することができます。#!/bin/bash source ~/stackrc time openstack overcloud deploy \ --stack central \ --templates /usr/share/openstack-tripleo-heat-templates/ \ -e /usr/share/openstack-tripleo-heat-templates/environments/nova-az-config.yaml \ -e ~/central/containers-env-file.yaml \ -e ~/central/overrides.yaml \ -e ~/central/site-name.yaml
openstack overcloud deploy
コマンドに、ネットワーク設定用の heat テンプレートを追加する必要があります。エッジアーキテクチャーの設計には、スパイン/リーフ型ネットワークが必要です。詳しくは、Spine Leaf Networking を参照してください。
5.2. ストレージが設定された中央サイトのデプロイ
マルチストアの Image サービスおよびバックエンドとしての Ceph Storage をデプロイするには、以下の手順を実施します。
前提条件
- 中央サイトおよび各アベイラビリティーゾーンまたはストレージサービスが必要な各地区での Ceph クラスター用ハードウェア
- 中央サイトおよび各アベイラビリティーゾーンまたはストレージサービスが必要な各地区での 3 つの Image サービスサーバー用ハードウェア
2 つまたはそれ以上のスタックで設定されるデプロイメントの例を以下に示します。
-
中央サイトに 1 つのスタック (
central
) -
エッジサイトに 1 つのスタック (
dcn0
) -
dcn0
と同様にデプロイされた追加のスタック (dcn1
、dcn2
、等)
手順
以下の手順で、中央サイトの初回デプロイメント手順の概要を説明します。
マルチストアの Image サービスを使用する DCN デプロイメントの例について、デプロイメントコマンドおよび環境ファイルを以下の手順で詳しく説明します。以下の手順には、ここでの目的とは関連しないが実際の設定には必要な要素 (ネットワーク設定など) は含まれていません。
ホームディレクトリーに、デプロイする各スタックのディレクトリーを作成します。
mkdir /home/stack/central mkdir /home/stack/dcn0 mkdir /home/stack/dcn1
利用可能なハードウェアに該当する設定パラメーターおよび Ceph クラスターの名前を設定します。詳しくは、Configuring Ceph with Custom Config Settings を参照してください。
cat > /home/stack/central/ceph.yaml << EOF parameter_defaults: CephClusterName: central CephAnsibleDisksConfig: osd_scenario: lvm osd_objectstore: bluestore devices: - /dev/sda - /dev/sdb CephPoolDefaultSize: 3 CephPoolDefaultPgNum: 128 EOF
実際の環境に適したロールを使用して、中央サイト用のロールを生成します。
openstack overcloud roles generate Compute Controller CephStorage \ -o ~/central/central_roles.yaml cat > /home/stack/central/role-counts.yaml << EOF parameter_defaults: ControllerCount: 3 ComputeCount: 2 CephStorage: 3 EOF
環境ファイル
~/central/central-images-env.yaml
を生成します。sudo openstack tripleo container image prepare \ -e containers.yaml \ --output-env-file ~/central/central-images-env.yaml
site-name.yaml
環境ファイルでサイトの命名規則を設定します。Nova アベイラビリティーゾーンと Cinder ストレージアベイラビリティーゾーンが一致している必要があります。cat > /home/stack/central/site-name.yaml << EOF parameter_defaults: NovaComputeAvailabilityZone: central ControllerExtraConfig: nova::availability_zone::default_schedule_zone: central NovaCrossAZAttach: false CinderStorageAvailabilityZone: central GlanceBackendID: central EOF
以下のような内容で
glance.yaml
テンプレートを設定します。parameter_defaults: GlanceEnabledImportMethods: web-download,copy-image GlanceBackend: rbd GlanceStoreDescription: 'central rbd glance store' GlanceBackendID: central CephClusterName: central
その他すべてのテンプレートを準備したら、
central
スタックをデプロイします。openstack overcloud deploy \ --stack central \ --templates /usr/share/openstack-tripleo-heat-templates/ \ -r ~/central/central_roles.yaml \ ... -e /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-ansible.yaml \ -e /usr/share/openstack-tripleo-heat-templates/environments/nova-az-config.yaml \ -e ~/central/central-images-env.yaml \ -e ~/central/role-counts.yaml \ -e ~/central/site-name.yaml \ -e ~/central/ceph.yaml \ -e ~/central/glance.yaml
openstack overcloud deploy
コマンドに、ネットワーク設定用の heat テンプレートを追加する必要があります。エッジアーキテクチャーの設計には、スパイン/リーフ型ネットワークが必要です。詳しくは、Spine Leaf Networking を参照してください。
ceph-ansible.yaml
ファイルのパラメーターは、以下のように設定されます。
- NovaEnableRbdBackend: true
- GlanceBackend: rbd
これらの設定を同時に使用すると、heat により glance.conf のパラメーター image_import_plugins
の値には image_conversion
が設定されます。これにより、glance image-create-via-import --disk-format qcow2…
等のコマンドで QCOW2 イメージが自動的に変換されます。
これは Ceph RBD に最適な設定です。イメージの変換を無効にするには、GlanceImageImportPlugin
パラメーターを使用します。
parameter_defaults: GlanceImageImportPlugin: []
5.3. 外部 Ceph の統合
分散コンピュートノード (DCN) アーキテクチャーの中央サイトをデプロイし、事前にデプロイした Red Hat Ceph Storage ソリューションを統合することができます。
前提条件
- 中央サイトおよび各アベイラビリティーゾーンまたはストレージサービスが必要な各地区での Ceph クラスター用ハードウェア
- 中央サイトおよび各アベイラビリティーゾーンまたはストレージサービスが必要な各地区での 3 つの Image サービスサーバー用ハードウェア
2 つまたはそれ以上のスタックで設定されるデプロイメントの例を以下に示します。
-
中央サイトに 1 つのスタック (
central
) -
エッジサイトに 1 つのスタック (
dcn0
) -
dcn0
と同様にデプロイされた追加のスタック (dcn1
、dcn2
、等)
Integrating an Overcloud with an Existing Red Hat Ceph Cluster に記載の手順に従って、既存の Red Hat Ceph Storage ソリューションと統合するように中央サイトをインストールできます。Red Hat Ceph Storage を DCN デプロイメントの中央サイトと統合するための特別な要件はありませんが、オーバークラウドをデプロイする前に DCN 固有の手順を完了する必要があります。
ホームディレクトリーに、デプロイする各スタックのディレクトリーを作成します。これを使用して、それぞれのサイト用に設計されたテンプレートを分離します。
mkdir /home/stack/central mkdir /home/stack/dcn0 mkdir /home/stack/dcn1
RHOSP director が管理するロールを使用して、中央サイトのロールを生成します。外部 Ceph と統合する場合には、Ceph ロールを使用しないでください。
cat > /home/stack/central/role-counts.yaml << EOF parameter_defaults: ControllerCount: 3 ComputeCount: 2 EOF
環境ファイル
~/central/central-images-env.yaml
を生成します。sudo openstack tripleo container image prepare \ -e containers.yaml \ --output-env-file ~/central/central-images-env.yaml
site-name.yaml
環境ファイルでサイトの命名規則を設定します。Compute (nova) アベイラビリティーゾーンと Block Storage (cinder) アベイラビリティーゾーンが一致している必要があります。cat > /home/stack/central/site-name.yaml << EOF parameter_defaults: NovaComputeAvailabilityZone: central ControllerExtraConfig: nova::availability_zone::default_schedule_zone: central NovaCrossAZAttach: false CinderStorageAvailabilityZone: central GlanceBackendID: central EOF
以下のような内容で
glance.yaml
テンプレートを設定します。parameter_defaults: GlanceEnabledImportMethods: web-download,copy-image GlanceBackend: rbd GlanceStoreDescription: 'central rbd glance store' GlanceBackendID: central CephClusterName: central
Ceph が Red Hat OpenStack Platform director を使用せずにデプロイされる場合には、
ceph-ansible.yaml
環境ファイルを使用しないでください。代わりにceph-ansible-external.yaml
環境ファイルを使用してください。openstack overcloud deploy \ --stack central \ --templates /usr/share/openstack-tripleo-heat-templates/ \ -r ~/central/central_roles.yaml \ ... -e /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-ansible-external.yaml \ -e /usr/share/openstack-tripleo-heat-templates/environments/nova-az-config.yaml \ -e ~/central/central-images-env.yaml \ -e ~/central/role-counts.yaml \ -e ~/central/site-name.yaml \ -e ~/central/ceph.yaml \ -e ~/central/glance.yaml
第6章 ストレージを使用しないエッジのデプロイ
中央サイトで Image サービス (glance) のバックエンドとして Object Storage サービス (swift) を使用する場合は、エッジサイトにブロックストレージを持たない分散コンピュートノードクラスターをデプロイすることができます。各アーキテクチャーのロールおよびネットワークプロファイルが異なるため、ブロックストレージを設定せずにデプロイされたサイトは、後でブロックストレージを持つように更新することはできません。
以下の手順では Block Storage サービス (cinder) のバックエンドとして lvm を使用していますが、実稼働環境用ではサポートされません。Block Storage サービスのバックエンドとして、認定されたブロックストレージソリューションをデプロイする必要があります。
6.1. ストレージを持たないエッジノードのデプロイ
コントロールプレーンに中央サイトを使用するエッジコンピュートノードをデプロイすることができます。以下の手順で、デプロイメントに新たな DCN スタックを追加し、既存の heat スタックからの設定を再利用して新たな環境ファイルを作成する方法について説明します。元の heat スタックにより、中央のデータセンター内にオーバークラウドがデプロイされます。リモートサイトにコンピュートノードをデプロイするために、追加の heat スタックを作成します。
6.1.1. 分散コンピュートノードの環境ファイルの設定
この手順で新しい central-export.yaml
環境ファイルを作成し、オーバークラウドからの plan-environment.yaml
ファイルのパスワードを使用します。central-export.yaml
ファイルには、取り扱いに注意を要するセキュリティーデータが含まれます。セキュリティー向上のために、必要がなくなったらファイルを削除してください。
--config-download-dir
オプション用のディレクトリーを指定する場合、デプロイメント時に director が /var/lib/mistral
に作成する中央のハブの Ansible 設定を使用します。openstack overcloud config download
コマンドで手動で生成する Ansible 設定は使用しないでください。手動で生成した設定には、デプロイメント操作時にのみ作成される特定のファイルは含まれません。
イメージをエッジサイトにコピーする前に、中央サイトにイメージをアップロードする必要があります。各イメージのコピーは、中央サイトの Image サービス (glance) に存在している必要があります。
Image、Compute、Block Storage サービスに、RBD ストレージドライバーを使用する必要があります。
手順
DCN サイトに必要な設定ファイルを生成します。
openstack overcloud export \ --config-download-dir /var/lib/mistral/central \ --stack central --output-file ~/dcn-common/central-export.yaml
実際の環境に適したロールを使用して、エッジロケーション用のロールを生成します。
openstack overcloud roles generate Compute -o ~/dcn0/dcn0_roles.yaml
ネットワークオーバーレイに ML2/OVS を使用している場合は、作成したロールファイルを編集して NeutronDhcpAgent
および NeutronMetadataAgent
ロールを含める必要があります。
... - OS::TripleO::Services::MySQLClient - OS::TripleO::Services::NeutronBgpVpnBagpipe + - OS::TripleO::Services::NeutronDhcpAgent + - OS::TripleO::Services::NeutronMetadataAgent - OS::TripleO::Services::NeutronLinuxbridgeAgent - OS::TripleO::Services::NeutronVppAgent - OS::TripleO::Services::NovaAZConfig - OS::TripleO::Services::NovaCompute ...
詳細は、Preparing for a routed provider network を参照してください。
6.1.2. DCN サイトへのコンピュートノードのデプロイ
以下の手順では、Compute
ロールを使用して、コンピュートノードを dcn0
という名前のアベイラビリティーゾーン (AZ) にデプロイします。分散コンピュートノード (DC) のコンテキストでは、このロールはストレージのないサイトに使用されます。
手順
dcn0/overrides.yaml で分散コンピュート (DCN) サイトのオーバーライドを確認します。
parameter_defaults: ComputeCount: 3 ComputeFlavor: baremetal ComputeSchedulerHints: 'capabilities:node': '0-compute-%index%' NovaAZAttach: false
以下の内容で、
~/dcn0
ディレクトリー内にsite-name.yaml
という名前の新たなファイルを作成します。resource_registry: OS::TripleO::Services::NovaAZConfig: /usr/share/openstack-tripleo-heat-templates/deployment/nova/nova-az-config.yaml parameter_defaults: NovaComputeAvailabilityZone: dcn0 RootStackName: dcn0
DCN サイトのコンテナーイメージを取得します。
sudo openstack tripleo container image prepare \ --environment-directory dcn0 \ -r ~/dcn0/roles_data.yaml \ -e ~/dcn-common/central-export.yaml \ -e ~/containers-prepare-parameter.yaml \ --output-env-file ~/dcn0/dcn0-images-env.yaml
dcn0 の deploy.sh デプロイメントスクリプトを実行します。
#!/bin/bash STACK=dcn0 source ~/stackrc time openstack overcloud deploy \ --stack $STACK \ --templates /usr/share/openstack-tripleo-heat-templates/ \ -e /usr/share/openstack-tripleo-heat-templates/environments/nova-az-config.yaml \ -e ~/dcn-common/central-export.yaml \ -e ~/dcn0/dcn0-images-env.yaml \ -e ~/dcn0/site-name.yaml \ -e ~/dcn0/overrides.yaml
network_data.yaml
ファイルへの編集が必要な追加のエッジサイトをデプロイする場合は、中央サイトでスタックの更新を実行する必要があります。エッジロケーションのデプロイ後、nova API データベースに nova
cell_v2
ホストマッピングを作成する必要があります。アンダークラウドで以下のコマンドを実行します。TRIPLEO_PLAN_NAME=central \ ansible -i /usr/bin/tripleo-ansible-inventory \ nova_api[0] -b -a \ "{{ container_cli }} exec -it nova_api \ nova-manage cell_v2 discover_hosts --by-service --verbose"
エッジサイトをスケールアップする場合には、このコマンドを再び実行する必要があります。
openstack overcloud deploy
コマンドに、ネットワーク設定用の heat テンプレートを追加する必要があります。エッジアーキテクチャーの設計には、スパイン/リーフ型ネットワークが必要です。詳しくは、Spine Leaf Networking を参照してください。
6.2. エッジサイトでの特定イメージ種別の除外
デフォルトでは、Compute ノードは、サポートするすべてのイメージ形式を公開します。Compute ノードが Ceph ストレージを使用しない場合には、イメージ形式の公開から RAW イメージを除外することができます。RAW イメージ形式は、QCOW2 イメージよりも多くのネットワーク帯域幅およびローカルストレージを使用し、Ceph ストレージを持たないエッジサイトでの使用は非効率です。特定のイメージ形式を除外するには、NovaImageTypeExcludeList
パラメーターを使用します。
Ceph には RAW イメージが必要なので、このパラメーターは Ceph を使用するエッジサイトには使用しないでください。
RAW イメージを公開しない Compute ノードは、RAW イメージから作成されたインスタンスをホストできません。これは、スナップショットの再デプロイおよび退避に影響を及ぼす可能性があります。
前提条件
- Red Hat OpenStack Platform director がインストールされている。
- 中央サイトがインストールされている。
- DCN のデプロイメントで Compute ノードが利用可能である。
手順
-
アンダークラウドホストに
stack
ユーザーとしてログインします。 source コマンドで
stackrc
認証情報ファイルを読み込みます。$ source ~/stackrc
カスタムテンプレートに
NovaImageTypeExcludeList
パラメーターを追加します。parameter_defaults: NovaImageTypeExcludeList: - raw
ご自分のデプロイメントに該当するその他の環境ファイルと共に、
NovaImageTypeExcludeList
パラメーターが含まれる環境ファイルをオーバークラウドデプロイメントコマンドに追加します。openstack overcloud deploy --templates \ -n network_data.yaml \ -r roles_data.yaml \ -e <environment_files> \ -e <new_environment_file>
第7章 エッジサイトでのストレージのデプロイ
Red Hat OpenStack Platform director を活用して分散コンピュートノードのデプロイメントを拡張し、Red Hat OpenStack Platform と Ceph Storage を使用する利点と共に、エッジサイトに分散イメージの管理および永続ストレージを含めることができます。
7.1. ストレージが設定されたエッジサイトのデプロイ
中央サイトをデプロイしたら、エッジサイトを構築し、各エッジロケーションがプライマリーとして自己のストレージバックエンドに接続し、さらに中央サイトのストレージバックエンドにも接続するようにします。
スパイン/リーフ型ネットワーク設定に加えて、この設定には ceph が必要とする storage
および storage_mgmt
ネットワークを含める必要があります。詳しくは、Spine leaf networking を参照してください。
glance イメージをサイト間で移動することができるように、中央サイトと各エッジサイトのストレージネットワーク間に接続が必要です。
中央サイトが各エッジサイトの mons
および osds
と通信できるようにしてください。ただし、ストレージ管理ネットワークは OSD のリバランスに使用されるため、サイト境界でストレージ管理ネットワークを終端する必要があります。
手順
central
スタックからスタック情報をエクスポートします。以下のコマンドを実行する前に、central
スタックをデプロイする必要があります。openstack overcloud export \ --config-download-dir /var/lib/mistral/central/ \ --stack central \ --output-file ~/dcn-common/central-export.yaml
注記config-download-dir
のデフォルト値は/var/lib/mistral/<stack>/
です。central_ceph_external.yaml
ファイルを作成します。この環境ファイルにより、DCN サイトが中央ハブの Ceph クラスターに接続されので、詳細は前の手順でデプロイした Ceph クラスターに固有のものです。sudo -E openstack overcloud export ceph \ --stack central \ --config-download-dir /var/lib/mistral \ --output-file ~/dcn-common/central_ceph_external.yaml
Ceph が Red Hat OpenStack Platform director を使用せずにデプロイされる場合には、
openstack overcloud export ceph
コマンドを実行できません。central_ceph_external.yaml
ファイルを手動で作成します。parameter_defaults: CephExternalMultiConfig: - cluster: "central" fsid: "3161a3b4-e5ff-42a0-9f53-860403b29a33" external_cluster_mon_ips: "172.16.11.84, 172.16.11.87, 172.16.11.92" keys: - name: "client.openstack" caps: mgr: "allow *" mon: "profile rbd" osd: "profile rbd pool=vms, profile rbd pool=volumes, profile rbd pool=images" key: "AQD29WteAAAAABAAphgOjFD7nyjdYe8Lz0mQ5Q==" mode: "0600" dashboard_enabled: false ceph_conf_overrides: client: keyring: /etc/ceph/central.client.openstack.keyring
fsid
パラメーターは、Ceph Storage クラスターのファイルシステム ID です。この値は、クラスター設定ファイルの[global]
セクションで指定します。[global] fsid = 4b5c8c0a-ff60-454b-a1b4-9747aa737d19 ...
key
パラメーターは、openstack アカウントの ceph クライアントキーです。[root@ceph ~]# ceph auth list ... [client.openstack] key = AQC+vYNXgDAgAhAAc8UoYt+OTz5uhV7ItLdwUw== caps mgr = "allow *" caps mon = "profile rbd" caps osd = "profile rbd pool=volumes, profile rbd pool=vms, profile rbd pool=images, profile rbd pool=backups, profile rbd pool=metrics" ...
central_ceph_external.yaml
ファイルのサンプルにあるパラメーターについての詳しい情報は、Creating a custom environment file を参照してください。
Image サービス設定のオーバーライド用に
~/dcn0/glance.yaml
ファイルを作成します。parameter_defaults: GlanceEnabledImportMethods: web-download,copy-image GlanceBackend: rbd GlanceStoreDescription: 'dcn0 rbd glance store' GlanceBackendID: dcn0 GlanceMultistoreConfig: central: GlanceBackend: rbd GlanceStoreDescription: 'central rbd glance store' CephClusterName: central GlanceRbdPoolName: images CephClientUserName: openstack
注記GlanceRbdPoolName
とCephClientUserName
パラメーターを glance マルチストア設定に使用しない場合、値は中央サイトの設定に使用したパラメーターから継承されます。これらの値は同じではない場合があり、デプロイに失敗する可能性があります。利用可能なハードウェアに該当する設定パラメーターで
ceph.yaml
ファイルを設定します。cat > /home/stack/dcn0/ceph.yaml << EOF parameter_defaults: CephClusterName: dcn0 CephAnsibleDisksConfig: osd_scenario: lvm osd_objectstore: bluestore devices: - /dev/sda - /dev/sdb CephPoolDefaultSize: 3 CephPoolDefaultPgNum: 128 EOF
詳しくは、Mapping the Ceph Storage node disk layout を参照してください。
実際の環境要件に適した以下のパラメーターが含まれるファイルを使用して、システムのチューニングを実施します。
cat > /home/stack/dcn0/tuning.yaml << EOF parameter_defaults: CephAnsibleExtraConfig: is_hci: true CephConfigOverrides: osd_recovery_op_priority: 3 osd_recovery_max_active: 3 osd_max_backfills: 1 ## Set relative to your hardware: # DistributedComputeHCIParameters: # NovaReservedHostMemory: 181000 # DistributedComputeHCIExtraConfig: # nova::cpu_allocation_ratio: 8.2 EOF
-
パラメーター
CephAnsibleExtraConfig
の値の設定については、Setting ceph-ansible group variables を参照してください。 -
パラメーター
CephConfigOverrides
の値の設定の詳細については、Customizing the Ceph Storage cluster を参照してください。
-
パラメーター
site-name.yaml
環境ファイルでサイトの命名規則を設定します。Nova アベイラビリティーゾーンと Cinder ストレージアベイラビリティーゾーンが一致している必要があります。ストレージと共にエッジサイトをデプロイする場合は、CinderVolumeCluster
パラメーターを含めます。このパラメーターは、エッジサイトで必要な cinder-volume をアクティブ/アクティブ設定としてデプロイする場合に使用されます。ベストプラクティスとしては、Cinder クラスター名をアベイラビリティーゾーンと一致するように設定します。cat > /home/stack/central/site-name.yaml << EOF parameter_defaults: ... NovaComputeAvailabilityZone: dcn0 NovaCrossAZAttach: false CinderStorageAvailabilityZone: dcn0 CinderVolumeCluster: dcn0
dcn0 のデプロイメントに使用する
roles.yaml
ファイルを生成します。以下に例を示します。openstack overcloud roles generate DistributedComputeHCI DistributedComputeHCIScaleOut -o ~/dcn0/roles_data.yaml
それぞれのロールに必要な値で
~/dcn0/roles-counts.yaml
ファイルを作成して、各ロールに番号システムを設定します。GlanceApiEdge サービスの要件を満たすには、3 つのノードを割り当てる必要があります。ハイパーコンバージドインフラストラクチャーには、DistributedComputeHCICount パラメーターを使用します。他のアーキテクチャーには、DistributedComputeCount パラメーターを使用します。
parameter_defaults: ControllerCount: 0 ComputeCount: 0 DistributedComputeHCICount: 3 DistributedComputeHCIScaleOutCount: 1 # Optional DistributedComputeScaleOutCount: 1 # Optional
エッジサイトのコンテナーイメージを取得します。
sudo openstack tripleo container image prepare \ --environment-directory dcn0 \ -r ~/dcn0/roles_data.yaml \ -e /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-ansible.yaml \ ... -e /home/stack/dcn-common/central-export.yaml \ -e /home/stack/containers-prepare-parameter.yaml \ --output-env-file ~/dcn0/dcn0-images-env.yaml
注記openstack tripleo container image prepare
コマンドに、デプロイメントに使用するすべての環境ファイルを追加する必要があります。エッジサイトをデプロイします。
openstack overcloud deploy \ --stack dcn0 \ --templates /usr/share/openstack-tripleo-heat-templates/ \ -r ~/dcn0/roles_data.yaml \ -e /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-ansible.yaml \ -e /usr/share/openstack-tripleo-heat-templates/environments/dcn-storage.yaml \ -e /usr/share/openstack-tripleo-heat-templates/environments/nova-az-config.yaml \ -e ~/dnc0/dcn0-images-env.yaml \ .... -e ~/dcn-common/central-export.yaml \ -e ~/dcn-common/central_ceph_external.yaml \ -e ~/dcn0/dcn_ceph_keys.yaml \ -e ~/dcn0/role-counts.yaml \ -e ~/dcn0/ceph.yaml \ -e ~/dcn0/site-name.yaml \ -e ~/dcn0/tuning.yaml \ -e ~/dcn0/glance.yaml
注記openstack overcloud deploy
コマンドに、ネットワーク設定用の heat テンプレートを追加する必要があります。エッジアーキテクチャーの設計には、スパイン/リーフ型ネットワークが必要です。詳しくは、Spine Leaf Networking を参照してください。エッジロケーションのデプロイ後、nova API データベースに nova
cell_v2
ホストマッピングを作成する必要があります。アンダークラウドで以下のコマンドを実行します。TRIPLEO_PLAN_NAME=central \ ansible -i /usr/bin/tripleo-ansible-inventory \ nova_api[0] -b -a \ "{{ container_cli }} exec -it nova_api \ nova-manage cell_v2 discover_hosts --by-service --verbose"
エッジサイトをスケールアップする場合には、このコマンドを再び実行する必要があります。
7.2. Ceph 専用ノードによるエッジサイトのデプロイ
Red Hat OpenStack Platform director を使用して専用の Ceph ノードをデプロイすることができます。
手順
central
スタックからスタック情報をエクスポートします。以下のコマンドを実行する前に、central
スタックをデプロイする必要があります。openstack overcloud export \ --config-download-dir /var/lib/mistral/central/ \ --stack central \ --output-file ~/dcn-common/central-export.yaml
注記config-download-dir
のデフォルト値は/var/lib/mistral/<stack>/
です。central_ceph_external.yaml
ファイルを作成します。この環境ファイルにより、DCN サイトが中央ハブの Ceph クラスターに接続されので、詳細は前の手順でデプロイした Ceph クラスターに固有のものです。sudo -E openstack overcloud export ceph \ --stack central \ --config-download-dir /var/lib/mistral \ --output-file ~/dcn-common/central_ceph_external.yaml
glance 設定のオーバーライド用に
~/dcn0/glance.yaml
ファイルを作成します。parameter_defaults: GlanceEnabledImportMethods: web-download,copy-image GlanceBackend: rbd GlanceStoreDescription: 'dcn0 rbd glance store' GlanceBackendID: dcn0 GlanceMultistoreConfig: central: GlanceBackend: rbd GlanceStoreDescription: 'central rbd glance store' CephClientUserName: 'openstack' CephClusterName: central
利用可能なハードウェアに該当する設定パラメーターで
ceph.yaml
ファイルを設定します。cat > /home/stack/dcn0/ceph.yaml << EOF parameter_defaults: CephClusterName: dcn0 CephAnsibleDisksConfig: osd_scenario: lvm osd_objectstore: bluestore devices: - /dev/sda - /dev/sdb CephPoolDefaultSize: 3 CephPoolDefaultPgNum: 128 EOF
詳しくは、Mapping the Ceph Storage node disk layout を参照してください。
site-name.yaml
環境ファイルでサイトの命名規則を設定します。Nova アベイラビリティーゾーンと Cinder ストレージアベイラビリティーゾーンが一致している必要があります。ストレージと共にエッジサイトをデプロイする場合は、CinderVolumeCluster
パラメーターを含めます。このパラメーターは、エッジサイトで必要な cinder-volume をアクティブ/アクティブ設定としてデプロイする場合に使用されます。ベストプラクティスとしては、Cinder クラスター名をアベイラビリティーゾーンと一致するように設定します。cat > /home/stack/dcn0/site-name.yaml << EOF parameter_defaults: ... NovaComputeAvailabilityZone: dcn0 NovaCrossAZAttach: false CinderStorageAvailabilityZone: dcn0 CinderVolumeCluster: dcn0
dcn0 のデプロイメントに使用する
roles.yaml
ファイルを生成します。以下に例を示します。openstack overcloud roles generate DistributedCompute DistributedComputeScaleOut CephAll-o ~/dcn0/roles_data.yaml
それぞれのロールに必要な値で
~/dcn0/roles-counts.yaml
ファイルを作成して、各ロールに番号システムを設定します。GlanceApiEdge サービスの要件を満たすために、DistributedCompute ロールに 3 つのノード、および
CephAll
ロールに 3 つのノードを割り当てる必要があります。parameter_defaults: ControllerCount: 0 ComputeCount: 0 DistributedComputeCount: 3 CephAll: 3 DistributedComputeScaleOutCount: 1 # Optional
エッジサイトのコンテナーイメージを取得します。
sudo openstack tripleo container image prepare \ --environment-directory dcn0 \ -r ~/dcn0/roles_data.yaml \ -e /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-ansible.yaml \ ... -e /home/stack/dcn-common/central-export.yaml \ -e /home/stack/containers-prepare-parameter.yaml \ --output-env-file ~/dcn0/dcn0-images-env.yaml
注記openstack tripleo container image prepare
コマンドに、デプロイメントに使用するすべての環境ファイルを追加する必要があります。エッジサイトをデプロイします。
openstack overcloud deploy \ --stack dcn0 \ --templates /usr/share/openstack-tripleo-heat-templates/ \ -r ~/dcn0/roles_data.yaml \ -e /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-ansible.yaml \ -e /usr/share/openstack-tripleo-heat-templates/environments/dcn-storage.yaml \ -e /usr/share/openstack-tripleo-heat-templates/environments/nova-az-config.yaml \ -e ~/dnc0/dcn0-images-env.yaml \ .... -e ~/dcn-common/central-export.yaml \ -e ~/dcn-common/central_ceph_external.yaml \ -e ~/dcn0/dcn_ceph_keys.yaml \ -e ~/dcn0/role-counts.yaml \ -e ~/dcn0/ceph.yaml \ -e ~/dcn0/site-name.yaml \ -e ~/dcn0/tuning.yaml \ -e ~/dcn0/glance.yaml
注記openstack overcloud deploy
コマンドに、ネットワーク設定用の heat テンプレートを追加する必要があります。エッジアーキテクチャーの設計には、スパイン/リーフ型ネットワークが必要です。詳しくは、Spine Leaf Networking を参照してください。エッジロケーションのデプロイ後、nova API データベースに nova
cell_v2
ホストマッピングを作成する必要があります。アンダークラウドで以下のコマンドを実行します。TRIPLEO_PLAN_NAME=central \ ansible -i /usr/bin/tripleo-ansible-inventory \ nova_api[0] -b -a \ "{{ container_cli }} exec -it nova_api \ nova-manage cell_v2 discover_hosts --by-service --verbose"
エッジサイトをスケールアップする場合には、このコマンドを再び実行する必要があります。
7.3. エッジでのインストール済み Red Hat Ceph Storage クラスターの使用
既存の Ceph クラスターを使用するように Red Hat OpenStack Platform を設定することができます。これは外部 Ceph のデプロイメントと呼ばれます。
前提条件
- レイテンシー要件を超えないように、DCN サイトのローカルにインストール済みの Ceph クラスターを用意する必要がある。
手順
Ceph クラスターに以下のプールを作成します。中央サイトにデプロイしている場合は、
backups
およびmetrics
プールを含めます。[root@ceph ~]# ceph osd pool create volumes <_PGnum_> [root@ceph ~]# ceph osd pool create images <_PGnum_> [root@ceph ~]# ceph osd pool create vms <_PGnum_> [root@ceph ~]# ceph osd pool create backups <_PGnum_> [root@ceph ~]# ceph osd pool create metrics <_PGnum_>
<_PGnum_> は配置グループの数に置き換えます。適切な値を判断するには、Ceph Placement Groups (PGs) per Pool Calculator も使用できます。
Ceph に OpenStack クライアントユーザーを作成し、Red Hat OpenStack Platform 環境が適切なプールにアクセスできるようにします。
ceph auth add client.openstack mon 'allow r' osd 'allow class-read object_prefix rbd_children, allow rwx pool=volumes, allow rwx pool=vms, allow rwx pool=images'
返された、提供された Ceph クライアントキーを保存します。アンダークラウドを設定する際に、このキーを
CephClientKey
パラメーターの値として使用します。注記このコマンドを中央サイトで実行し、Cinder バックアップまたは Telemetry サービスを使用する予定の場合、コマンドに allow rwx pool=backups, allow pool=metrics を追加します。
Ceph Storage クラスターのファイルシステム ID を保存します。Ceph 設定ファイルの
[global]
セクションのfsid
パラメーターの値は、ファイルシステム ID です。[global] fsid = 4b5c8c0a-ff60-454b-a1b4-9747aa737d19 ...
この値は、アンダークラウドを設定する際に
CephClusterFSID
パラメーターの値として使用します。アンダークラウド上で環境ファイルを作成し、ノードが非マネージド Ceph クラスターに接続するように設定します。ceph-external-<SITE>.yaml など、認識可能な命名規則を使用します。ここで、SITE はデプロイメントの場所に置き換えます (例: ceph-external-central.yaml、ceph-external-dcn1.yaml 等)。
parameter_defaults: # The cluster FSID CephClusterFSID: '4b5c8c0a-ff60-454b-a1b4-9747aa737d19' # The CephX user auth key CephClientKey: 'AQDLOh1VgEp6FRAAFzT7Zw+Y9V6JJExQAsRnRQ==' # The list of IPs or hostnames of the Ceph monitors CephExternalMonHost: '172.16.1.7, 172.16.1.8, 172.16.1.9' # The desired name of the generated key and conf files CephClusterName: dcn1
- CephClusterFSID および CephClientKey パラメーターには、以前に保存した値を使用します。
- CephExternalMonHost パラメーターの値として、Ceph モニターの ip アドレスのコンマ区切りリストを使用します。
-
CephClusterName
パラメーターには、エッジサイト間で一意の値を選択する必要があります。名前を再利用すると、設定ファイルが上書きされます。
Red Hat OpenStack Platform director を使用して Red Hat Ceph Storage を中央サイトにデプロイした場合、ceph の設定を環境ファイル
central_ceph_external.yaml
にエクスポートできます。この環境ファイルにより、DCN サイトが中央ハブの Ceph クラスターに接続されので、詳細は前の手順でデプロイした Ceph クラスターに固有のものです。sudo -E openstack overcloud export ceph \ --stack central \ --config-download-dir /var/lib/mistral \ --output-file ~/dcn-common/central_ceph_external.yaml
中央サイトの外に Red Hat Ceph Storage がデプロイされている場合、
openstack overcloud export ceph
コマンドを使用してcentral_ceph_external.yaml
ファイルを生成することはできません。代わりに central_ceph_external.yaml ファイルを手動で作成する必要があります。parameter_defaults: CephExternalMultiConfig: - cluster: "central" fsid: "3161a3b4-e5ff-42a0-9f53-860403b29a33" external_cluster_mon_ips: "172.16.11.84, 172.16.11.87, 172.16.11.92" keys: - name: "client.openstack" caps: mgr: "allow *" mon: "profile rbd" osd: "profile rbd pool=vms, profile rbd pool=volumes, profile rbd pool=images" key: "AQD29WteAAAAABAAphgOjFD7nyjdYe8Lz0mQ5Q==" mode: "0600" dashboard_enabled: false ceph_conf_overrides: client: keyring: /etc/ceph/central.client.openstack.keyring
各サイトについて同様の詳細を記述した環境ファイルを作成し、中央サイトには非マネージド Red Hat Ceph Storage クラスターを使用します。
openstack overcloud export ceph
コマンドは、非マネージド Red Hat Ceph Storage クラスターがあるサイトでは機能しません。中央サイトを更新すると、このファイルによって、中央サイトはエッジサイトのストレージクラスターをセカンダリーロケーションとして使用できるようになります。parameter_defaults: CephExternalMultiConfig: cluster: dcn1 … cluster: dcn2 …
オーバークラウドのデプロイ時に、ceph-ansible-external.yaml、ceph-external-<SITE>.yaml、および central_ceph_external.yaml 環境ファイルを使用します。
openstack overcloud deploy \ --stack dcn1 \ --templates /usr/share/openstack-tripleo-heat-templates/ \ -r ~/dcn1/roles_data.yaml \ -e /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-ansible-external.yaml \ -e /usr/share/openstack-tripleo-heat-templates/environments/dcn-hci.yaml \ -e /usr/share/openstack-tripleo-heat-templates/environments/nova-az-config.yaml \ -e ~/dnc1/ceph-external-dcn1.yaml \ .... -e ~/dcn-common/central-export.yaml \ -e ~/dcn-common/central_ceph_external.yaml \ -e ~/dcn1/dcn_ceph_keys.yaml \ -e ~/dcn1/role-counts.yaml \ -e ~/dcn1/ceph.yaml \ -e ~/dcn1/site-name.yaml \ -e ~/dcn1/tuning.yaml \ -e ~/dcn1/glance.yaml
- すべてのエッジサイトが配置された後、中央サイトを再デプロイします。
7.4. 追加の分散コンピュートノードサイトの作成
新しい分散コンピュートノード (DCN) サイトには、アンダークラウド上に独自の YAML ファイルのディレクトリーがあります。詳細は、「個別の heat スタックの管理」 を参照してください。以下の手順で、コマンドの例を説明します。
手順
アンダークラウドの stack ユーザーとして、
dcn9
用に新規ディレクトリーを作成します。$ cd ~ $ mkdir dcn9
既存の
dcn0
テンプレートを新しいディレクトリーにコピーし、dcn0
の文字列をdcn9
に置き換えます。$ cp dcn0/ceph.yaml dcn9/ceph.yaml $ sed s/dcn0/dcn9/g -i dcn9/ceph.yaml $ cp dcn0/overrides.yaml dcn9/overrides.yaml $ sed s/dcn0/dcn9/g -i dcn9/overrides.yaml $ sed s/"0-ceph-%index%"/"9-ceph-%index%"/g -i dcn9/overrides.yaml $ cp dcn0/deploy.sh dcn9/deploy.sh $ sed s/dcn0/dcn9/g -i dcn9/deploy.sh
-
dcn9
ディレクトリーのファイルを調べ、要件を満たしていることを確認します。 undercloud.conf を編集して、新しいリーフを追加します。以下の例では、leaf9 を undercloud.conf に追加します。
[leaf0] cidr = 192.168.10.0/24 dhcp_start = 192.168.10.10 dhcp_end = 192.168.10.90 inspection_iprange = 192.168.10.100,192.168.10.190 gateway = 192.168.10.1 masquerade = False … [leaf9] cidr = 192.168.19.0/24 dhcp_start = 192.168.19.10 dhcp_end = 192.168.19.90 inspection_iprange = 192.168.19.100,192.168.19.190 gateway = 192.168.10.1 masquerade = False
- openstack undercloud install コマンドを再度実行して、環境設定を更新します。
オーバークラウドのテンプレートで、
NetworkDeploymentActions
パラメーターの値を["CREATE"]
の値から["CREATE", "UPDATE"]
の値に更新します。このパラメーターが現在テンプレートに含まれていない場合は、環境ファイルのいずれかに追加するか、新しい環境ファイルを作成します。cat > /home/stack/central/network-environment.yaml << EOF parameter_defaults: NetworkDeploymentActions: ["CREATE", "UPDATE"] EOF
中央サイトのデプロイスクリプトを実行します。中央サイトの初回デプロイ時に使用した全テンプレートと、新たに作成または編集した network-environment.yaml ファイルを含めします。
openstack overcloud deploy \ --stack central \ --templates /usr/share/openstack-tripleo-heat-templates/ \ -r ~/central/roles_data.yaml \ -e /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-ansible.yaml \ -e /usr/share/openstack-tripleo-heat-templates/environments/dcn-hci.yaml \ -e /usr/share/openstack-tripleo-heat-templates/environments/nova-az-config.yaml \ -e ~/central/dcn9-images-env.yaml \ .... -e ~/dcn-common/central-export.yaml \ -e ~/dcn-common/central_ceph_external.yaml \ -e ~/central/dcn_ceph_keys.yaml \ -e ~/central/role-counts.yaml \ -e ~/central/ceph.yaml \ -e ~/central/site-name.yaml \ -e ~/central/tuning.yaml \ -e ~/central/glance.yaml
ノードが利用可能で、
Provisioning state
の状態にあることを確認します。$ openstack baremetal node list
ノードが利用可能な場合は、適切なすべてのテンプレートで新しいエッジサイトをデプロイします。
openstack overcloud deploy \ --stack dcn9 \ --templates /usr/share/openstack-tripleo-heat-templates/ \ -r ~/dcn9/roles_data.yaml \ -e /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-ansible.yaml \ -e /usr/share/openstack-tripleo-heat-templates/environments/dcn-hci.yaml \ -e /usr/share/openstack-tripleo-heat-templates/environments/nova-az-config.yaml \ -e ~/dnc9/dcn9-images-env.yaml \ .... -e ~/dcn-common/central-export.yaml \ -e ~/dcn-common/central_ceph_external.yaml \ -e ~/dcn9/dcn_ceph_keys.yaml \ -e ~/dcn9/role-counts.yaml \ -e ~/dcn9/ceph.yaml \ -e ~/dcn9/site-name.yaml \ -e ~/dcn9/tuning.yaml \ -e ~/dcn9/glance.yaml
- エッジ間の直接通信でロケーションをデプロイしている場合は、各エッジサイトを再デプロイして、ルートを更新し、新しいロケーションとの通信を確立する必要があります。
7.5. 中央サイトの更新
サンプルの手順を使用してすべてのエッジサイトを設定およびデプロイしたら、中央の Image サービスがイメージをエッジサイトにプッシュできるように、中央サイトの設定を更新します。
この手順では、Image サービス (glance) を再起動し、長く実行されている Image サービスプロセスを中断します。たとえば、セントラルイメージサービスサーバーから DCN イメージサービスサーバーにイメージをコピーしている場合、そのイメージコピーは中断されるため、再起動する必要があります。詳細は、Clearing residual data after interrupted Image service processes を参照してください。
手順
以下のような内容で
~/central/glance_update.yaml
ファイルを作成します。以下の例には、2 つのエッジサイト dcn0 および dcn1 の設定が含まれています。parameter_defaults: GlanceEnabledImportMethods: web-download,copy-image GlanceBackend: rbd GlanceStoreDescription: 'central rbd glance store' CephClusterName: central GlanceBackendID: central GlanceMultistoreConfig: dcn0: GlanceBackend: rbd GlanceStoreDescription: 'dcn0 rbd glance store' CephClientUserName: 'openstack' CephClusterName: dcn0 GlanceBackendID: dcn0 dcn1: GlanceBackend: rbd GlanceStoreDescription: 'dcn1 rbd glance store' CephClientUserName: 'openstack' CephClusterName: dcn1 GlanceBackendID: dcn1
dcn_ceph.yaml
ファイルを作成します。以下の例では、このファイルは、エッジサイトdcn0
およびdcn1
の Ceph クラスターのクライアントとして、中央サイトの glance サービスを設定します。sudo -E openstack overcloud export ceph \ --stack dcn0,dcn1 \ --config-download-dir /var/lib/mistral \ --output-file ~/central/dcn_ceph.yaml
元のテンプレートを使用して中央サイトを再デプロイする際に、新たに作成した
dcn_ceph.yaml
およびglance_update.yaml
ファイルを追加します。openstack overcloud deploy \ --stack central \ --templates /usr/share/openstack-tripleo-heat-templates/ \ -r ~/central/central_roles.yaml \ ... -e /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-ansible.yaml \ -e /usr/share/openstack-tripleo-heat-templates/environments/nova-az-config.yaml \ -e ~/central/central-images-env.yaml \ -e ~/central/role-counts.yaml \ -e ~/central/site-name.yaml -e ~/central/ceph.yaml \ -e ~/central/ceph_keys.yaml \ -e ~/central/glance.yaml \ -e ~/central/dcn_ceph_external.yaml
中央サイトのコントローラーで、
cinder-volume
サービスを再起動します。cinder-backup
サービスと一緒に中央サイトをデプロイしている場合は、cinder-backup
サービスも再起動してください。ssh heat-admin@controller-0 sudo pcs resource restart openstack-cinder-volume ssh heat-admin@controller-0 sudo pcs resource restart openstack-cinder-backup
7.5.1. イメージサービスプロセス中断後の残存データの消去
中央サイトを再起動すると、長時間稼働している Image サービス (glance) のプロセスが中断されます。これらのプロセスを再起動する前に、まず、再起動した Controller ノード、および Ceph と Image サービスのデータベースに残っているデータをクリーンアップする必要があります。
手順
再起動した Controller ノードの残留データを確認し、消去します。ステージングストア用の
glance-api.conf
ファイル内のファイルと、Image サービスデータベース内の対応するイメージ (例:<image_ID>.raw
) を比較します。- これらの対応するイメージのステータスがインポート中の場合、イメージを再作成する必要があります。
- イメージのステータスがアクティブの場合、ステージングからデータを削除し、コピーのインポートを再起動する必要があります。
-
Ceph ストアの残留データをチェックおよび消去します。ステージングエリアから消去したイメージは、そのイメージを含む Ceph ストアの
stores
プロパティーに一致するレコードがなければなりません。Ceph におけるイメージ名は、Image サービスデータベースのイメージ ID です。 イメージサービスデータベースのクリア中断されたインポートジョブからインポートステータスになっているイメージをすべて消去します。
$ glance image-delete <image_id>
7.6. DCN への Red Hat Ceph Storage Dashboard のデプロイ
手順
Red Hat Ceph Storage Dashboard を中央サイトにデプロイするには、Adding the Red Hat Ceph Storage Dashboard to an overcloud deployment を参照してください。中央サイトをデプロイする前に、これらの手順を完了する必要があります。
Red Hat Ceph Storage Dashboard をエッジロケーションにデプロイするには、中央サイトで完了した手順と同じ手順を実行します。ただし、以下の手順を実施する必要があります。
エッジサイトをデプロイするためのテンプレートで、
ManageNetworks
パラメーターの値がfalse
となるようにしてください。ManageNetworks
をfalse
に設定すると、エッジサイトは中央スタックですでに作成された既存のネットワークを使用します。parameter_defaults: ManageNetworks: false
- 高可用性の仮想 IP を作成するには、負荷分散用に独自のソリューションをデプロイする必要があります。エッジサイトでは haproxy および pacemaker はデプロイされません。Red Hat Ceph Storage Dashboard をエッジロケーションにデプロイする場合、デプロイメントはストレージネットワーク上で公開されます。Dashboard は、負荷分散ソリューションなしに異なる IP アドレスを持つ 3 つの DistributedComputeHCI ノードにそれぞれインストールされます。
Ceph Dashboard を公開することのできる仮想 IP をホストする追加のネットワークを作成することができます。複数のスタックでネットワークリソースを再使用しないでください。ネットワークリソースの再利用に関する詳細は、複数スタックでのネットワークリソースの再利用 を参照してください。
この追加ネットワークリソースを作成するには、提供される network_data_dashboard.yaml
heat テンプレートを使用します。作成されるネットワークの名前は StorageDashboard
です。
手順
-
Red Hat OpenStack Platform director に
stack
としてログインします。 DistributedComputeHCIDashboard
ロールおよびお使いの環境に適したその他のロールを生成します。openstack overcloud roles generate DistributedComputeHCIDashboard -o ~/dnc0/roles.yaml
オーバークラウドデプロイコマンドに
roles.yaml
およびnetwork_data_dashboard.yaml
を追加します。$ openstack overcloud deploy --templates \ -r ~/<dcn>/<dcn_site_roles>.yaml \ -n /usr/share/openstack-tripleo-heat-templates/network_data_dashboard.yaml \ -e <overcloud_environment_files> \ ... -e /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-ansible.yaml \ -e /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-dashboard.yaml
デプロイメントでは、Dashboard が有効なストレージネットワーク上の 3 つの IP アドレスが提供されます。
検証
Dashboard が中央サイトで動作し、Ceph クラスターから表示されるデータが正しいことを確認するには、Accessing Ceph Dashboard を参照してください。
同様の手順で Dashboard がエッジロケーションで動作していることを確認できますが、エッジロケーションにロードバランサーが存在しないので例外があります。
-
/var/lib/mistral/<stackname>/ceph-ansible/group_vars/all.yml
から、選択したスタックに固有の Dashboard 管理者のログイン認証情報を取得します。 選択したスタックに固有のインベントリー
/var/lib/mistral/<stackname>/ceph-ansible/inventory.yml
で、DistributedComputeHCI ロールホストのリストを見つけ、storage_ip
の値を 3 つすべて保存します。以下の例では、最初の 2 つの Dashboard IP は 172.16.11.84 と 172.16.11.87 です。DistributedComputeHCI: hosts: dcn1-distributed-compute-hci-0: ansible_host: 192.168.24.16 ... storage_hostname: dcn1-distributed-compute-hci-0.storage.localdomain storage_ip: 172.16.11.84 ... dcn1-distributed-compute-hci-1: ansible_host: 192.168.24.22 ... storage_hostname: dcn1-distributed-compute-hci-1.storage.localdomain storage_ip: 172.16.11.87
- これらの IP アドレスにアクセス可能な場合は、Ceph Dashboard がそのいずれかでアクティブであることを確認することができます。これらの IP アドレスはストレージネットワーク上にあり、ルーティングされません。これらの IP アドレスが利用できない場合、インベントリーから取得する 3 つの IP アドレスのロードバランサーを設定して、検証用に仮想 IP アドレスを取得する必要があります。
第8章 DistributedComputeHCI ノードの置き換え
ハードウェアのメンテナンス中に、エッジサイトの DistributedComputeHCI ノードのスケールダウン、スケールアップ、または置き換えが必要になる場合があります。DistributedComputeHCI ノードを置き換えるには、置き換えるノードからサービスを削除し、ノード数をスケールダウンしてから、これらのノードを再びスケールアップする手順に従います。
8.1. Compute (nova) サービスの削除
nova-compute サービスを無効にして、該当するネットワークエージェントを削除します。
手順
スタックから削除するノードを削除します。
`openstack overcloud node delete --stack <dcn2> \ <computehci2-1>
削除するノードのネットワークエージェントを削除します。
(central) [stack@site-undercloud-0 ~]$ openstack network agent list | grep dcn2 … | 17726d1a-e9d1-4e57-b40d-e742be5d073c | Open vSwitch agent | dcn2-computehci2-1.redhat.local | None | XXX | UP | neutron-openvswitch-agent | … (central) [stack@site-undercloud-0 ~]$ openstack network agent delete 17726d1a-e9d1-4e57-b40d-e742be5d073c
8.2. Red Hat Ceph Storage サービスの削除
Red Hat Ceph サービス mon
、mgr
、および osd
を削除するには、削除するノードのクラスターサービスから ceph-osd
を無効および削除してから、mon
サービス、mgr
サービス、および osd
サービスを停止して、無効にする必要があります。
手順
SSH を使用して、削除する DistributedComputeHCI ノードに接続し、root ユーザーとしてログインします。
$ ssh heat-admin@<dcn-computehci-node> $ sudo su - #
削除する DistributedComputeHCI ノードに関連付けられた OSD を特定します。
[root@dcn2-computehci2-1 ~]# podman exec ceph-mon-dnc2-computehci2-1 ceph osd tree -c /etc/ceph/dcn2.conf … -3 0.24399 host dcn2-computehci2-1 1 hdd 0.04880 osd.1 up 1.00000 1.00000 7 hdd 0.04880 osd.7 up 1.00000 1.00000 11 hdd 0.04880 osd.11 up 1.00000 1.00000 15 hdd 0.04880 osd.15 up 1.00000 1.00000 18 hdd 0.04880 osd.18 up 1.00000 1.00000 …
関連する Ceph ノードの OSD を無効化します。
[root@dcn2-computehci2-1 ~]# podman exec ceph-mon-dcn2-computehci2-1 ceph osd out 1 7 11 15 18 -c /etc/ceph/dcn2.conf marked out osd.1. marked out osd.7. marked out osd.11. marked out osd.15. marked out osd.18.
Ceph osd リバランシングが終了するのを待ちます。以下のコマンドを使用して進捗を監視します。
[root@dcn2-computehci2-1 ~]# podman exec ceph-mon-dcn2-computehci2-1 ceph -w -c /etc/ceph/dcn2.conf … mon.dcn2-computehci2-2 has auth_allow_insecure_global_id_reclaim set to true
auth_allow_insecure_global_id_reclaim
がtrue
に設定されると、リバランスが完了します。OSD を停止し、無効にします。
[root@dcn2-computehci2-1 ~]# systemctl stop ceph-osd@1 [root@dcn2-computehci2-1 ~]# systemctl stop ceph-osd@7 [root@dcn2-computehci2-1 ~]# systemctl stop ceph-osd@11 [root@dcn2-computehci2-1 ~]# systemctl stop ceph-osd@15 [root@dcn2-computehci2-1 ~]# systemctl stop ceph-osd@18 [root@dcn2-computehci2-1 ~]# systemctl disable ceph-osd@1 Removed /etc/systemd/system/multi-user.target.wants/ceph-osd@1.service. [root@dcn2-computehci2-1 ~]# systemctl disable ceph-osd@7 Removed /etc/systemd/system/multi-user.target.wants/ceph-osd@7.service. [root@dcn2-computehci2-1 ~]# systemctl disable ceph-osd@11 Removed /etc/systemd/system/multi-user.target.wants/ceph-osd@11.service. [root@dcn2-computehci2-1 ~]# systemctl disable ceph-osd@15 Removed /etc/systemd/system/multi-user.target.wants/ceph-osd@15.service. [root@dcn2-computehci2-1 ~]# systemctl disable ceph-osd@18 Removed /etc/systemd/system/multi-user.target.wants/ceph-osd@18.service.
CRUSH マップから OSD を削除します。
[root@dcn2-computehci2-1 ~]# podman exec ceph-mon-dcn2-computehci2-1 ceph osd crush remove osd.1 -c /etc/ceph/dcn2.conf removed item id 1 name 'osd.1' from crush map [root@dcn2-computehci2-1 ~]# podman exec ceph-mon-dcn2-computehci2-1 ceph osd crush remove osd.7 -c /etc/ceph/dcn2.conf removed item id 7 name 'osd.7' from crush map [root@dcn2-computehci2-1 ~]# podman exec ceph-mon-dcn2-computehci2-1 ceph osd crush remove osd.11 -c /etc/ceph/dcn2.conf removed item id 11 name 'osd.11' from crush map [root@dcn2-computehci2-1 ~]# podman exec ceph-mon-dcn2-computehci2-1 ceph osd crush remove osd.15 -c /etc/ceph/dcn2.conf removed item id 15 name 'osd.15' from crush map [root@dcn2-computehci2-1 ~]# podman exec ceph-mon-dcn2-computehci2-1 ceph osd crush remove osd.18 -c /etc/ceph/dcn2.conf removed item id 18 name 'osd.18' from crush map
OSD 認証キーを削除します。
[root@dcn2-computehci2-1 ~]# podman exec ceph-mon-dcn2-computehci2-1 ceph auth del osd.1 -c /etc/ceph/dcn2.conf updated [root@dcn2-computehci2-1 ~]# podman exec ceph-mon-dcn2-computehci2-1 ceph auth del osd.7 -c /etc/ceph/dcn2.conf updated [root@dcn2-computehci2-1 ~]# podman exec ceph-mon-dcn2-computehci2-1 ceph auth del osd.11 -c /etc/ceph/dcn2.conf updated [root@dcn2-computehci2-1 ~]# podman exec ceph-mon-dcn2-computehci2-1 ceph auth del osd.15 -c /etc/ceph/dcn2.conf updated [root@dcn2-computehci2-1 ~]# podman exec ceph-mon-dcn2-computehci2-1 ceph auth del osd.18 -c /etc/ceph/dcn2.conf updated
クラスターから OSD を削除します。
[root@dcn2-computehci2-1 ~]# podman exec ceph-mon-dcn2-computehci2-1 ceph osd rm 1 -c /etc/ceph/dcn2.conf removed osd.1 [root@dcn2-computehci2-1 ~]# podman exec ceph-mon-dcn2-computehci2-1 ceph osd rm 7 -c /etc/ceph/dcn2.conf removed osd.7 [root@dcn2-computehci2-1 ~]# podman exec ceph-mon-dcn2-computehci2-1 ceph osd rm 11 -c /etc/ceph/dcn2.conf removed osd.11 [root@dcn2-computehci2-1 ~]# podman exec ceph-mon-dcn2-computehci2-1 ceph osd rm 15 -c /etc/ceph/dcn2.conf removed osd.15 [root@dcn2-computehci2-1 ~]# podman exec ceph-mon-dcn2-computehci2-1 ceph osd rm 18 -c /etc/ceph/dcn2.conf removed osd.18
CRUSH マップから DistributedComputeHCI ノードを削除します。
[root@dcn2-computehci2-1 ~]# podman exec ceph-mon-dcn2-computehci2-1 ceph osd crush rm dcn2-computehci2-1 -c /etc/ceph/dcn2.conf removed item id -3 name 'dcn2-computehci2-1' from crush map
mon
サービスを停止し、無効にします。[root@dcn2-computehci2-1 ~]# systemctl --type=service | grep ceph ceph-crash@dcn2-computehci2-1.service loaded active running Ceph crash dump collector ceph-mgr@dcn2-computehci2-1.service loaded active running Ceph Manager ceph-mon@dcn2-computehci2-1.service loaded active running Ceph Monitor [root@dcn2-computehci2-1 ~]# systemctl stop ceph-mon@dcn2-computehci2-1 [root@dcn2-computehci2-1 ~]# systemctl disable ceph-mon@dcn2-computehci2-1 Removed /etc/systemd/system/multi-user.target.wants/ceph-mon@dcn2-computehci2-1.service.
SSH を使用して、同じクラスター内の別のノードに接続し、クラスターからモニターを削除します。出力の v1 および v2 エントリーに留意してください。
[root@dcn2-computehci2-0 ~]# podman exec ceph-mon-dcn2-computehci2-0 ceph mon remove dcn2-computehci2-1 -c /etc/ceph/dcn2.conf removing mon.dcn2-computehci2-1 at [v2:172.23.3.153:3300/0,v1:172.23.3.153:6789/0], there will be 2 monitors
すべての dcn2 ノードで、前の手順で出力された /etc/ceph/dcn2.conf の v1 および v2 モニターエントリーと、'mon initial members' からノード名を削除します。
更新前
mon host = [v2:172.23.3.150:3300,v1:172.23.3.150:6789],*[v2:172.23.3.153:3300,v1:172.23.3.153:6789]*,[v2:172.23.3.124:3300,v1:172.23.3.124:6789] + mon initial members = dcn2-computehci2-0,*dcn2-computehci2-1*,dcn2-computehci2-2
更新後
mon host = [v2:172.23.3.150:3300,v1:172.23.3.150:6789],[v2:172.23.3.124:3300,v1:172.23.3.124:6789] + mon initial members = dcn2-computehci2-0,dcn2-computehci2-2
mgr
サービスを停止し、無効にします。[root@dcn2-computehci2-1 ~]# systemctl --type=service | grep ceph ceph-crash@dcn2-computehci2-1.service loaded active running Ceph crash dump collector ceph-mgr@dcn2-computehci2-1.service loaded active running Ceph Manager [root@dcn2-computehci2-1 ~]# systemctl stop ceph-mgr@dcn2-computehci2-1 [root@dcn2-computehci2-1 ~]# systemctl --type=service | grep ceph ceph-crash@dcn2-computehci2-1.service loaded active running Ceph crash dump collector [root@dcn2-computehci2-1 ~]# systemctl disable ceph-mgr@dcn2-computehci2-1 Removed /etc/systemd/system/multi-user.target.wants/ceph-mgr@dcn2-computehci2-1.service.
ノードの
mgr
サービスがクラスターから削除されていることを確認します。[root@dcn2-computehci2-0 ~]# podman exec ceph-mon-dcn2-computehci2-0 ceph -s -c /etc/ceph/dcn2.conf cluster: id: b9b53581-d590-41ac-8463-2f50aa985001 health: HEALTH_WARN 3 pools have too many placement groups mons are allowing insecure global_id reclaim services: mon: 2 daemons, quorum dcn2-computehci2-2,dcn2-computehci2-0 (age 2h) mgr: dcn2-computehci2-2(active, since 20h), standbys: dcn2-computehci2-0 1 osd: 15 osds: 15 up (since 3h), 15 in (since 3h) data: pools: 3 pools, 384 pgs objects: 32 objects, 88 MiB usage: 16 GiB used, 734 GiB / 750 GiB avail pgs: 384 active+clean
- 1
mgr
サービスが正常に削除されると、mgr
が削除されたノードはリスト表示されなくなります。
8.3. Image サービス (glance) サービスの削除
サービスからノードを削除した時に、Image サービスを削除します。
手順
Image サービスを無効にするには、削除するノードで
systemctl
を使用して無効にします。[root@dcn2-computehci2-1 ~]# systemctl stop tripleo_glance_api.service [root@dcn2-computehci2-1 ~]# systemctl stop tripleo_glance_api_tls_proxy.service [root@dcn2-computehci2-1 ~]# systemctl disable tripleo_glance_api.service Removed /etc/systemd/system/multi-user.target.wants/tripleo_glance_api.service. [root@dcn2-computehci2-1 ~]# systemctl disable tripleo_glance_api_tls_proxy.service Removed /etc/systemd/system/multi-user.target.wants/tripleo_glance_api_tls_proxy.service.
8.4. Block Storage (cinder) サービスの削除
DistributedComputeHCI ノードをサービスから削除する際に、cinder-volume
サービスと etcd
サービスを DistributedComputeHCI ノード から削除する必要があります。
手順
削除するノードの
cinder-volume
サービスを特定して無効にします。(central) [stack@site-undercloud-0 ~]$ openstack volume service list --service cinder-volume | cinder-volume | dcn2-computehci2-1@tripleo_ceph | az-dcn2 | enabled | up | 2022-03-23T17:41:43.000000 | (central) [stack@site-undercloud-0 ~]$ openstack volume service set --disable dcn2-computehci2-1@tripleo_ceph cinder-volume
スタック内の別の DistributedComputeHCI ノードにログインします。
$ ssh heat-admin@dcn2-computehci2-0
削除するノードに関連付けられた
cinder-volume
サービスを削除します。[root@dcn2-computehci2-0 ~]# podman exec -it cinder_volume cinder-manage service remove cinder-volume dcn2-computehci2-1@tripleo_ceph Service cinder-volume on host dcn2-computehci2-1@tripleo_ceph removed.
削除するノードで
tripleo_cinder_volume
サービスを停止して無効にします。[root@dcn2-computehci2-1 ~]# systemctl stop tripleo_cinder_volume.service [root@dcn2-computehci2-1 ~]# systemctl disable tripleo_cinder_volume.service Removed /etc/systemd/system/multi-user.target.wants/tripleo_cinder_volume.service
8.5. DistributedComputeHCI ノードの削除
環境を保存するには、openstack overcloud node delete
コマンドに、関連するすべてのテンプレートおよび環境ファイルが含まれている必要があります。
手順
DistributedComputeHCI ノードの削除
$ openstack overcloud node delete / --stack <stack-name> / <node_UUID>
ノードを再利用する場合は、ironic を使用してディスクをクリーンアップします。これは、ノードが Ceph OSD をホストする場合に必要です。
openstack baremetal node manage $UUID openstack baremetal node clean $UUID --clean-steps '[{"interface":"deploy", "step": "erase_devices_metadata"}]' openstack baremetal provide $UUID
8.6. 削除された DistributedComputeHCI ノードの置き換え
8.6.1. 削除された DistributedComputeHCI ノードの置き換え
DCN デプロイメントに新しい HCI ノードを追加するには、追加のノードでエッジスタックを再デプロイし、そのスタックの ceph export
を実行してから、中央ロケーションのスタック更新を実行する必要があります。中央ロケーションのスタック更新により、エッジサイトに固有の設定が追加されます。
前提条件
ノードの置き換えまたは新しいノードの追加先となるスタックの nodes_data.yaml ファイルで、ノード数が正常である。
手順
デプロイスクリプトから呼び出されるテンプレートの 1 つで、
EtcdIntialClusterState
パラメーターをexisting
に設定する必要があります。parameter_defaults: EtcdInitialClusterState: existing
スタックに固有のデプロイメントスクリプトを使用して再デプロイします。
(undercloud) [stack@site-undercloud-0 ~]$ ./overcloud_deploy_dcn2.sh … Overcloud Deployed without error
スタックから Red Hat Ceph Storage データをエクスポートします。
(undercloud) [stack@site-undercloud-0 ~]$ sudo -E openstack overcloud export ceph --stack dcn1,dcn2 --config-download-dir /var/lib/mistral --output-file ~/central/dcn2_scale_up_ceph_external.yaml
- 中央ロケーションのデプロイスクリプトで、dcn_ceph_external.yaml を新しく生成された dcn2_scale_up_ceph_external.yaml と置き換えます。
中央でスタックの更新を実行します。
(undercloud) [stack@site-undercloud-0 ~]$ ./overcloud_deploy.sh ... Overcloud Deployed without error
8.7. 置き換えられた DistributedComputeHCI ノードの機能の検証
status
フィールドの値がenabled
で、State
フィールドの値がup
であることを確認します。(central) [stack@site-undercloud-0 ~]$ openstack compute service list -c Binary -c Host -c Zone -c Status -c State +----------------+-----------------------------------------+------------+---------+-------+ | Binary | Host | Zone | Status | State | +----------------+-----------------------------------------+------------+---------+-------+ ... | nova-compute | dcn1-compute1-0.redhat.local | az-dcn1 | enabled | up | | nova-compute | dcn1-compute1-1.redhat.local | az-dcn1 | enabled | up | | nova-compute | dcn2-computehciscaleout2-0.redhat.local | az-dcn2 | enabled | up | | nova-compute | dcn2-computehci2-0.redhat.local | az-dcn2 | enabled | up | | nova-compute | dcn2-computescaleout2-0.redhat.local | az-dcn2 | enabled | up | | nova-compute | dcn2-computehci2-2.redhat.local | az-dcn2 | enabled | up | ...
すべてのネットワークエージェントが
up
状態にあることを確認します。(central) [stack@site-undercloud-0 ~]$ openstack network agent list -c "Agent Type" -c Host -c Alive -c State +--------------------+-----------------------------------------+-------+-------+ | Agent Type | Host | Alive | State | +--------------------+-----------------------------------------+-------+-------+ | DHCP agent | dcn3-compute3-1.redhat.local | :-) | UP | | Open vSwitch agent | central-computehci0-1.redhat.local | :-) | UP | | DHCP agent | dcn3-compute3-0.redhat.local | :-) | UP | | DHCP agent | central-controller0-2.redhat.local | :-) | UP | | Open vSwitch agent | dcn3-compute3-1.redhat.local | :-) | UP | | Open vSwitch agent | dcn1-compute1-1.redhat.local | :-) | UP | | Open vSwitch agent | central-computehci0-0.redhat.local | :-) | UP | | DHCP agent | central-controller0-1.redhat.local | :-) | UP | | L3 agent | central-controller0-2.redhat.local | :-) | UP | | Metadata agent | central-controller0-1.redhat.local | :-) | UP | | Open vSwitch agent | dcn2-computescaleout2-0.redhat.local | :-) | UP | | Open vSwitch agent | dcn2-computehci2-5.redhat.local | :-) | UP | | Open vSwitch agent | central-computehci0-2.redhat.local | :-) | UP | | DHCP agent | central-controller0-0.redhat.local | :-) | UP | | Open vSwitch agent | central-controller0-1.redhat.local | :-) | UP | | Open vSwitch agent | dcn2-computehci2-0.redhat.local | :-) | UP | | Open vSwitch agent | dcn1-compute1-0.redhat.local | :-) | UP | ...
Ceph クラスターのステータスを確認します。
SSH を使用して新しい DistributedComputeHCI ノードに接続し、Ceph クラスターのステータスを確認します。
[root@dcn2-computehci2-5 ~]# podman exec -it ceph-mon-dcn2-computehci2-5 \ ceph -s -c /etc/ceph/dcn2.conf
新規ノードに ceph mon サービスと ceph mgr サービスの両方が存在することを確認します。
services: mon: 3 daemons, quorum dcn2-computehci2-2,dcn2-computehci2-0,dcn2-computehci2-5 (age 3d) mgr: dcn2-computehci2-2(active, since 3d), standbys: dcn2-computehci2-0, dcn2-computehci2-5 osd: 20 osds: 20 up (since 3d), 20 in (since 3d)
ceph osds のステータスを 'ceph osd tree' で確認します。新規ノードの osds すべてが STATUS up にあることを確認します。
[root@dcn2-computehci2-5 ~]# podman exec -it ceph-mon-dcn2-computehci2-5 ceph osd tree -c /etc/ceph/dcn2.conf ID CLASS WEIGHT TYPE NAME STATUS REWEIGHT PRI-AFF -1 0.97595 root default -5 0.24399 host dcn2-computehci2-0 0 hdd 0.04880 osd.0 up 1.00000 1.00000 4 hdd 0.04880 osd.4 up 1.00000 1.00000 8 hdd 0.04880 osd.8 up 1.00000 1.00000 13 hdd 0.04880 osd.13 up 1.00000 1.00000 17 hdd 0.04880 osd.17 up 1.00000 1.00000 -9 0.24399 host dcn2-computehci2-2 3 hdd 0.04880 osd.3 up 1.00000 1.00000 5 hdd 0.04880 osd.5 up 1.00000 1.00000 10 hdd 0.04880 osd.10 up 1.00000 1.00000 14 hdd 0.04880 osd.14 up 1.00000 1.00000 19 hdd 0.04880 osd.19 up 1.00000 1.00000 -3 0.24399 host dcn2-computehci2-5 1 hdd 0.04880 osd.1 up 1.00000 1.00000 7 hdd 0.04880 osd.7 up 1.00000 1.00000 11 hdd 0.04880 osd.11 up 1.00000 1.00000 15 hdd 0.04880 osd.15 up 1.00000 1.00000 18 hdd 0.04880 osd.18 up 1.00000 1.00000 -7 0.24399 host dcn2-computehciscaleout2-0 2 hdd 0.04880 osd.2 up 1.00000 1.00000 6 hdd 0.04880 osd.6 up 1.00000 1.00000 9 hdd 0.04880 osd.9 up 1.00000 1.00000 12 hdd 0.04880 osd.12 up 1.00000 1.00000 16 hdd 0.04880 osd.16 up 1.00000 1.00000
新しい DistributedComputeHCI ノードの
cinder-volume
サービスがステータス ‘enabled' にあり、状態が ‘up' であることを確認します。(central) [stack@site-undercloud-0 ~]$ openstack volume service list --service cinder-volume -c Binary -c Host -c Zone -c Status -c State +---------------+---------------------------------+------------+---------+-------+ | Binary | Host | Zone | Status | State | +---------------+---------------------------------+------------+---------+-------+ | cinder-volume | hostgroup@tripleo_ceph | az-central | enabled | up | | cinder-volume | dcn1-compute1-1@tripleo_ceph | az-dcn1 | enabled | up | | cinder-volume | dcn1-compute1-0@tripleo_ceph | az-dcn1 | enabled | up | | cinder-volume | dcn2-computehci2-0@tripleo_ceph | az-dcn2 | enabled | up | | cinder-volume | dcn2-computehci2-2@tripleo_ceph | az-dcn2 | enabled | up | | cinder-volume | dcn2-computehci2-5@tripleo_ceph | az-dcn2 | enabled | up | +---------------+---------------------------------+------------+---------+-------+
注記cinder-volume
サービスの状態がdown
の場合には、サービスはノードで起動していません。ssh を使用して新しい DistributedComputeHCI ノードに接続し、Glance サービスのステータスを ‘systemctl' で確認します。
[root@dcn2-computehci2-5 ~]# systemctl --type service | grep glance tripleo_glance_api.service loaded active running glance_api container tripleo_glance_api_healthcheck.service loaded activating start start glance_api healthcheck tripleo_glance_api_tls_proxy.service loaded active running glance_api_tls_proxy container
8.8. DistributedComputeHCI の状態ダウンのトラブルシューティング
代替ノードが EtcdInitialClusterState パラメーターの値を existing
に設定せずにデプロイされている場合、openstack volume service list
を実行すると、置き換えられたノードの cinder-volume
サービスは down
と表示されます。
手順
置き換えノードにログインし、etcd サービスのログを確認します。
etcd
サービスがクラスター ID の不一致を報告していることが、/var/log/containers/stdouts/etcd.log
のログファイルに表示されていることを確認します。2022-04-06T18:00:11.834104130+00:00 stderr F 2022-04-06 18:00:11.834045 E | rafthttp: request cluster ID mismatch (got 654f4cf0e2cfb9fd want 918b459b36fe2c0c)
-
EtcdInitialClusterState
パラメーターをデプロイメントテンプレートのexisting
の値に設定し、デプロイメントスクリプトを再実行します。 SSH を使用して代替ノードに接続し、root で以下のコマンドを実行します。
[root@dcn2-computehci2-4 ~]# systemctl stop tripleo_etcd [root@dcn2-computehci2-4 ~]# rm -rf /var/lib/etcd/* [root@dcn2-computehci2-4 ~]# systemctl start tripleo_etcd
/var/log/containers/stdouts/etcd.log
ログファイルを再チェックし、ノードが正常にクラスターに参加していることを確認します。2022-04-06T18:24:22.130059875+00:00 stderr F 2022-04-06 18:24:22.129395 I | etcdserver/membership: added member 96f61470cd1839e5 [https://dcn2-computehci2-4.internalapi.redhat.local:2380] to cluster 654f4cf0e2cfb9fd
-
cinder-volume サービスの状態を確認し、
openstack volume service list
を実行する際に置き換えノードでup
を読み取ることを確認します。
第9章 Key Manager を含むデプロイ
Red Hat OpenStack Platform 16.1.2 リリース以前にエッジサイトをデプロイしている場合は、この機能を実装するのに roles.yaml を再生成する必要があります。機能を実装するには、DCN サイトのデプロイメントに使用する roles.yaml
ファイルを再生成します。
$ openstack overcloud roles generate DistributedComputeHCI DistributedComputeHCIScaleOut -o ~/dcn0/roles_data.yaml
9.1. Key Manager が設定されたエッジサイトのデプロイ
エッジサイトに Key Manager (barbican) サービスへのアクセスを含める場合、中央サイトに barbican を設定する必要があります。Barbican のインストールおよび設定の詳細は、Deploying Barbican を参照してください。
/usr/share/openstack-tripleo-heat-templates/environments/services/barbican-edge.yaml
を含めることで、DCN サイトからの barbican へのアクセスを設定することができます。openstack overcloud deploy \ --stack dcn0 \ --templates /usr/share/openstack-tripleo-heat-templates/ \ -r ~/dcn0/roles_data.yaml \ .... -e /usr/share/openstack-tripleo-heat-templates/environments/services/barbican-edge.yaml
第10章 glance イメージの nova への事前キャッシュ
ローカルの一時ストレージを使用するように OpenStack Compute を設定する場合、インスタンスのデプロイメントを迅速化するために glance イメージがキャッシュされます。インスタンスに必要なイメージがまだキャッシュされていない場合は、インスタンスの作成時に Compute ノードのローカルディスクにダウンロードされます。
glance イメージのダウンロードプロセスに要する時間は、イメージのサイズおよび帯域幅やレイテンシー等のネットワーク特性によって変動します。
インスタンスの起動を試みる際にローカルの Ceph クラスターでイメージが利用できない場合は、以下のメッセージと共にインスタンスの起動に失敗します。
Build of instance 3c04e982-c1d1-4364-b6bd-f876e399325b aborted: Image 20c5ff9d-5f54-4b74-830f-88e78b9999ed is unacceptable: No image locations are accessible
Compute サービスのログには以下のメッセージが記録されます。
'Image %s is not on my ceph and [workarounds]/ never_download_image_if_on_rbd=True; refusing to fetch and upload.',
インスタンスの起動に失敗する原因は、nova.conf
設定ファイルの never_download_image_if_on_rbd
パラメーターです。DCN デプロイメントの場合、このパラメーターはデフォルトでは true
に設定されています。dcn-hci.yaml
ファイルの heat パラメーター NovaDisableImageDownloadToRbd
を使用して、この値を制御することができます。
オーバークラウドのデプロイ前に NovaDisableImageDownloadToRbd
の値を false
に設定した場合の動作は、以下のようになります。
-
イメージがローカルで利用できない場合、Compute サービス (nova) は
central
サイトで利用可能なイメージを自動的にストリーミングします。 - glance イメージからの COW コピーは使用されません。
- イメージを使用するインスタンスの数により、Compute (nova) ストレージに同じイメージのコピーが複数含まれる場合があります。
-
central
サイトへの WAN リンクと nova ストレージプールの両方が飽和状態になる可能性があります。
Red Hat では、この値を true に設定したままにし、インスタンスの起動前に必要なイメージがローカルで利用できるようにすることを推奨します。イメージをエッジサイトで利用できるようにする方法については、「新規サイトへのイメージのコピー」を参照してください。
ローカルにあるイメージに関して、tripleo_nova_image_cache.yml
Ansible Playbook を使用して、共通的に使用されるイメージや今後デプロイする可能性の高いイメージを事前キャッシュして、仮想マシンの作成を迅速化することができます。
10.1. tripleo_nova_image_cache.yml
Ansible Playbook の実行
前提条件
- シェル環境での正しい API への認証用クレデンシャル
各手順で提供されるコマンドの前に、正しい認証ファイルが読み込まれている必要があります。
手順
スタック用の Ansible インベントリーファイルを作成します。複数のスタックをコンマ区切りリストで指定して、複数サイトのイメージをキャッシュすることができます。
$ source stackrc $ tripleo-ansible-inventory --plan central,dcn0,dcn1 \ --static-yaml-inventory inventory.yaml
事前キャッシュするイメージの ID リストを作成します。
利用可能なイメージの完全なリストを取得します。
$ source centralrc $ openstack image list +--------------------------------------+---------+--------+ | ID | Name | Status | +--------------------------------------+---------+--------+ | 07bc2424-753b-4f65-9da5-5a99d8383fe6 | image_0 | active | | d5187afa-c821-4f22-aa4b-4e76382bef86 | image_1 | active | +--------------------------------------+---------+--------+
nova_cache_args.yml
という名前で Ansible Playbook の引数ファイルを作成し、事前キャッシュするイメージの ID を追加します。--- tripleo_nova_image_cache_images: - id: 07bc2424-753b-4f65-9da5-5a99d8383fe6 - id: d5187afa-c821-4f22-aa4b-4e76382bef86
tripleo_nova_image_cache.yml
Ansible Playbook を実行します。$ source centralrc $ ansible-playbook -i inventory.yaml \ --extra-vars "@nova_cache_args.yml" \ /usr/share/ansible/tripleo-playbooks/tripleo_nova_image_cache.yml
10.2. パフォーマンスに関する考慮事項
Ansible の forks
パラメーターを使用して、同時にダウンロードするイメージの数を指定することができます。このパラメーターのデフォルト値は 5
です。forks
パラメーターの値を増やして、このイメージの配布に要する時間を短縮することができます。ただし、ネットワークおよび glance-api の負荷が増えることとバランスを取る必要があります。
以下のように、--forks
パラメーターを使用して同時実行を調整します。
ansible-playbook -i inventory.yaml \ --forks 10 \ --extra-vars "@nova_cache_args.yml" \ /usr/share/ansible/tripleo-playbooks/tripleo_nova_image_cache.yml
10.3. DCN サイトへのイメージ配布の最適化
glance イメージの配布にプロキシーを使用して、WAN トラフィックを軽減することができます。プロキシーを設定した場合の動作は、以下のようになります。
- glance イメージは、プロキシーとして機能する 1 台の Compute ノードにダウンロードされます。
- プロキシーは、glance イメージをインベントリー内の他の Compute ノードに再配布します。
Ansible の引数ファイル nova_cache_args.yml
に以下のパラメーターを追加して、プロキシーノードを設定することができます。
tripleo_nova_image_cache_use_proxy
パラメーターを true
に設定して、イメージキャッシュプロキシーを有効にします。
イメージプロキシーは、セキュアなコピー scp
を使用して、イメージをインベントリー内の他のノードに配布します。DCN サイト間の WAN 等レイテンシーが高いネットワークを通じて配布する場合は、SCP は効率的ではありません。Red Hat では、Playbook のターゲットを 1 つの DCN サイト (1 つのスタックに対応) に制限することを推奨します。
tripleo_nova_image_cache_proxy_hostname
パラメーターを使用して、イメージキャッシュプロキシーを選択します。デフォルトのプロキシーは、Ansible インベントリーファイルで最初に定義されているコンピュートノードです。tripleo_nova_image_cache_plan
パラメーターを使用して、Playbook のインベントリーを 1 つのサイトに制限します。
tripleo_nova_image_cache_use_proxy: true tripleo_nova_image_cache_proxy_hostname: dcn0-novacompute-1 tripleo_nova_image_cache_plan: dcn0
10.4. nova-cache クリーンアップの設定
バックグラウンドプロセスが定期的に実行され、以下の両方の条件を満たすイメージが nova キャッシュから削除されます。
- イメージがインスタンスによって使用されていない。
-
イメージの経過時間が nova パラメーター
remove_unused_original_minimum_age_seconds
の設定値を超えている。
remove_unused_original_minimum_age_seconds
パラメーターのデフォルト値は 86400
です。値は秒単位で表され、これは 24 時間に相当します。初回デプロイメント時またはクラウドのスタック更新時に、tripleo-heat-templates パラメーター NovaImageCachTTL
を使用してこの値を制御することができます。
parameter_defaults: NovaImageCacheTTL: 604800 # Default to 7 days for all compute roles Compute2Parameters: NovaImageCacheTTL: 1209600 # Override to 14 days for the Compute2 compute role
Playbook により Compute ノードにすでに存在するイメージを事前キャッシュすると、Ansible は変更を報告せず、イメージの経過時間は 0 にリセットされます。NovaImageCacheTTL
パラメーターの値よりも頻繁に Ansible のプレイを実行し、イメージのキャッシュを維持します。
第11章 DCN への TLS-e の適用
分散コンピュートノードインフラストラクチャー用に設計されたクラウドで、TLS (Transport Layer Security) を有効にすることができます。パブリックアクセスだけに TLS を有効にするか、TLS-e としてすべてのネットワークで TLS を有効にすることができます。後者の場合、すべての内部および外部データフローで暗号化を行うことができます。
エッジサイトにはパブリックエンドポイントがないため、エッジスタックでパブリックアクセスを有効にすることはできません。パブリックアクセスの TLS の詳細は、Enabling SSL/TLS on Overcloud Public Endpoints を参照してください。
11.1. TLS-e を設定した分散コンピュートノードアーキテクチャーのデプロイ
前提条件
Red Hat Identity Manager (IdM) と共に Red Hat OpenStack Platform (RHOSP) 分散コンピュートノードアーキテクチャーで TLS-e を設定する場合には、Red Hat Identity Manager 用にデプロイされた Red Hat Enterprise Linux のバージョンに基づいて、以下のアクションを実行します。
- Red Hat Enterprise Linux 8.4
-
Red Hat Identity Management ノードで、
ipa-ext.conf
ファイルの ACL に対して信頼されるサブネットを許可します。
acl "trusted_network" { localnets; localhost; 192.168.24.0/24; 192.168.25.0/24; };
/etc/named/ipa-options-ext.conf
ファイルで、再帰とクエリーキャッシュを許可します。allow-recursion { trusted_network; }; allow-query-cache { trusted_network; };
named-pkcs11 サービスを再起動します。
systemctl restart named-pkcs11
-
Red Hat Identity Management ノードで、
- Red Hat Enterprise Linux 8.2
- Red Hat Enterprise Linux (RHEL) 8.2 に Red Hat Identity Manager (IdM) がある場合は、Red Hat Enterprise Linux をアップグレードしてから、RHEL 8.4 の指示に従ってください。
- Red Hat Enterprise Linux 7.x
-
Red Hat Enterprise Linux (RHEL) 7.x に Red Hat Identity Manager (IdM) がある場合は、ドメイン名のアクセス制御手順 (ACI) を手動で追加する必要があります。たとえば、ドメイン名が
redhat.local
の場合は、Red Hat Identity Manager で以下のコマンドを実行して ACI を設定します。
ADMIN_PASSWORD=redhat_01 DOMAIN_LEVEL_1=local DOMAIN_LEVEL_2=redhat cat << EOF | ldapmodify -x -D "cn=Directory Manager" -w ${ADMIN_PASSWORD} dn: cn=dns,dc=${DOMAIN_LEVEL_2},dc=${DOMAIN_LEVEL_1} changetype: modify add: aci aci: (targetattr = "aaaarecord || arecord || cnamerecord || idnsname || objectclass || ptrrecord")(targetfilter = "(&(objectclass=idnsrecord)(|(aaaarecord=)(arecord=)(cnamerecord=)(ptrrecord=)(idnsZoneActive=TRUE)))")(version 3.0; acl "Allow hosts to read DNS A/AAA/CNAME/PTR records"; allow (read,search,compare) userdn = "ldap:///fqdn=*,cn=computers,cn=accounts,dc=${DOMAIN_LEVEL_2},dc=${DOMAIN_LEVEL_1}";) EOF
手順
分散コンピュートノード (DCN) アーキテクチャーで TLS-e を実装する場合は、従来の novajoin
手法ではなく Ansible ベースの tripleo-ipa
手法を使用する必要があります。tripleo-ipa
を使用した TLS-e のデプロイに関する詳細は、Implementing TLS-e with Ansible を参照してください。
tripleo-ipa
を使用して DCN アーキテクチャーに TLS-e をデプロイするには、以下の手順も完了する必要があります。
エッジサイトにストレージをデプロイする場合は、エッジスタック用に変更した tripleo heat テンプレートに以下のパラメーターを追加します。
TEMPLATES=/usr/share/openstack-tripleo-heat-templates resource_registry: OS::TripleO::Services::IpaClient: ${TEMPLATES}/deployment/ipa/ipaservices-baremetal-ansible.yaml parameter_defaults: EnableEtcdInternalTLS: true
中央サイトとエッジロケーションの設計の違いのため、エッジスタックには以下のファイルを含めないでください。
- tls-everywhere-endpoints-dns.yaml
- エッジサイトではこのファイルは無視され、このファイルで設定されるエンドポイントは中央スタックからエクスポートされるエンドポイントによってオーバーライドされます。
- haproxy-public-tls-certmonger.yaml
- エッジサイトにはパブリックエンドポイントがないため、このファイルはデプロイメント失敗の原因になります。
第12章 外部アクセス用 Ceph キーの作成
Ceph ストレージへの外部アクセスとは、ローカルではない任意のサイトからの Ceph へのアクセスを指します。中央サイトにとってはエッジサイトの Ceph ストレージが外部にあたるのとまったく同じように、中央サイトの Ceph ストレージは、エッジ (DCN) サイトからは外部に該当します。
Ceph ストレージと共に中央サイトまたは DCN サイトをデプロイする場合、ローカルアクセスと外部アクセスの両方にデフォルトの openstack
キーリングを使用するオプションが可能です。あるいは、ローカル以外のサイトからのアクセス用に別の鍵を作成することができます。
外部サイトへのアクセスに追加の Ceph キーを使用する場合は、それぞれのキーの名前を同じにする必要があります。以降の例では、鍵の名前を external
としています。
ローカル以外のサイトからのアクセスに別の鍵を使用すると、セキュリティーが向上します。ローカルアクセスを中断すること無く、セキュリティーイベントに対応して外部アクセス用の鍵を無効にして再発行することができます。ただし、外部アクセスに別の鍵を使用すると、アベイラビリティーゾーンをまたがるバックアップやオフラインボリューム移行など、一部の機能を利用することができなくなります。セキュリティー対応のニーズと必要な機能セットの間でバランスを取る必要があります。
デフォルトでは、中央サイトおよびすべての DCN サイトの鍵は共有されます。
12.1. 外部アクセス用 Ceph キーの作成
ローカル以外のサイトからのアクセス用に external
鍵を作成するには、以下の手順を実施します。
Process
外部アクセス用の Ceph キーを作成します。この鍵の取り扱いには注意が必要です。以下のコマンドを使用して鍵を生成することができます。
python3 -c 'import os,struct,time,base64; key = os.urandom(16) ; \ header = struct.pack("<hiih", 1, int(time.time()), 0, len(key)) ; \ print(base64.b64encode(header + key).decode())'
デプロイするスタックのディレクトリーにおいて、以下のような内容で
ceph_keys.yaml
環境ファイルを作成します。鍵には、前のステップのコマンド出力を使用します。parameter_defaults: CephExtraKeys: - name: "client.external" caps: mgr: "allow *" mon: "profile rbd" osd: "profile rbd pool=vms, profile rbd pool=volumes, profile rbd pool=images" key: "AQD29WteAAAAABAAphgOjFD7nyjdYe8Lz0mQ5Q==" mode: "0600"
サイトのデプロイメントに
ceph_keys.yaml
環境ファイルを追加します。たとえば、ceph_keys.yaml
環境ファイルを指定して中央サイトをデプロイするには、以下のようなコマンドを実行します。overcloud deploy \ --stack central \ --templates /usr/share/openstack-tripleo-heat-templates/ \ …. -e ~/central/ceph_keys.yaml
12.2. 外部 Ceph キーの使用
すでにデプロイされている鍵だけを使用することができます。external
鍵と共にサイトをデプロイする際の詳細は、「外部アクセス用 Ceph キーの作成」を参照してください。この手順は、中央サイトとエッジサイトの両方で実施する必要があります。
中央サイトの提供する
external
鍵を使用するエッジサイトをデプロイする場合は、以下の手順を実施します。エッジサイト用の
dcn_ceph_external.yaml
環境ファイルを作成します。cephx-key-client-name
オプションを追加して、含めるべきデプロイした鍵を指定する必要があります。sudo -E openstack overcloud export ceph \ --stack central \ --config-download-dir /var/lib/mistral \ --cephx-key-client-name external \ --output-file ~/dcn-common/dcn_ceph_external.yaml
-
エッジサイトが中央サイトの Ceph クラスターにアクセスできるように、
dcn_ceph_external.yaml
ファイルを追加します。ceph_keys.yaml
ファイルを追加して、エッジサイトの Ceph クラスター用外部鍵をデプロイします。
エッジサイトのデプロイ後に中央サイトを更新する場合は、中央サイトが dcn
external
鍵を使用するようにします。CephClientUserName
パラメーターがエクスポートされる鍵と一致するようにします。以降の例に示すように、external
の名前を使用している場合は、以下のような内容でglance_update.yaml
を作成します。parameter_defaults: GlanceEnabledImportMethods: web-download,copy-image GlanceBackend: rbd GlanceStoreDescription: 'central rbd glance store' CephClusterName: central GlanceBackendID: central GlanceMultistoreConfig: dcn0: GlanceBackend: rbd GlanceStoreDescription: 'dcn0 rbd glance store' CephClientUserName: 'external' CephClusterName: dcn0 GlanceBackendID: dcn0 dcn1: GlanceBackend: rbd GlanceStoreDescription: 'dcn1 rbd glance store' CephClientUserName: 'external' CephClusterName: dcn1 GlanceBackendID: dcn1
openstack overcloud export ceph
コマンドを使用する際に、中央サイトから DCN エッジサイトへのアクセス用にexternal
鍵を追加します。そのためには、--stack
引数にスタックのコンマ区切りリストを指定し、cephx-key-client-name
オプションを指定する必要があります。sudo -E openstack overcloud export ceph \ --stack dcn0,dcn1,dcn2 \ --config-download-dir /var/lib/mistral \ --cephx-key-client-name external \ --output-file ~/central/dcn_ceph_external.yaml
元のテンプレートを使用して中央サイトを再デプロイする際に、新たに作成した
dcn_ceph_external.yaml
およびglance_update.yaml
ファイルを追加します。openstack overcloud deploy \ --stack central \ --templates /usr/share/openstack-tripleo-heat-templates/ \ -r ~/central/central_roles.yaml \ ... -e /usr/share/openstack-tripleo-heat-templates/environments/ceph-ansible/ceph-ansible.yaml \ -e /usr/share/openstack-tripleo-heat-templates/environments/nova-az-config.yaml \ -e ~/central/central-images-env.yaml \ -e ~/central/role-counts.yaml \ -e ~/central/site-name.yaml -e ~/central/ceph.yaml \ -e ~/central/ceph_keys.yaml \ -e ~/central/glance.yaml \ -e ~/central/dcn_ceph_external.yaml
付録A デプロイメントの移行オプション
本項では、DCN ストレージの検証と、アーキテクチャーの移行または変更に関するトピックについて説明します。
A.1. エッジストレージの検証
中央サイトおよびエッジサイトのデプロイメントが機能していることを確認するには、glance マルチストアおよびインスタンスの作成をテストします。
ローカルのファイルシステム上または Web サーバーで利用可能なイメージを glance にインポートすることができます。
中央サイトにイメージを使用するインスタンスがない場合でも、必ず中央サイトにイメージのコピーを保存してください。
前提条件
glance stores-info
コマンドを使用して、Image サービスを通じて利用可能なストアを確認します。以下の例では、central、dcn1、および dcn2 の 3 つのストアが利用可能です。これらは、それぞれ中央サイトおよびエッジサイトの glance ストアに対応します。$ glance stores-info +----------+----------------------------------------------------------------------------------+ | Property | Value | +----------+----------------------------------------------------------------------------------+ | stores | [{"default": "true", "id": "central", "description": "central rbd glance | | | store"}, {"id": "dcn0", "description": "dcn0 rbd glance store"}, | | | {"id": "dcn1", "description": "dcn1 rbd glance store"}] | +----------+----------------------------------------------------------------------------------+
A.1.1. ローカルファイルからのインポート
まず中央サイトのストアにイメージをアップロードし、続いてそれをリモートサイトにコピーする必要があります。
イメージのファイルが RAW 形式であることを確認します。イメージが raw 形式でなければ、イメージを Image サービスにインポートする前に変換する必要があります。
file cirros-0.5.1-x86_64-disk.img cirros-0.5.1-x86_64-disk.img: QEMU QCOW2 Image (v3), 117440512 bytes qemu-img convert -f qcow2 -O raw cirros-0.5.1-x86_64-disk.img cirros-0.5.1-x86_64-disk.raw
Import the image into the default back end at the central site:
glance image-create \ --disk-format raw --container-format bare \ --name cirros --file cirros-0.5.1-x86_64-disk.raw \ --store central
A.1.2. Web サーバーからのイメージのインポート
イメージが Web サーバーでホストされている場合は、GlanceImageImportPlugins
パラメーターを使用して複数のストアにイメージをアップロードすることができます。
この手順では、デフォルトのイメージ変換プラグインが glance で有効になっていることを前提としています。この機能により、QCOW2 ファイル形式が Ceph RBD に最適な RAW イメージに自動的に変換されます。glance image-show ID | grep disk_format
を実行して、glance イメージが RAW 形式であることを確認することができます。
手順
glance
コマンドのimage-create-via-import
パラメーターを使用して、Web サーバーからイメージをインポートします。--stores
パラメーターを使用します。# glance image-create-via-import \ --disk-format qcow2 \ --container-format bare \ --name cirros \ --uri http://download.cirros-cloud.net/0.4.0/cirros-0.4.0-x86_64-disk.img \ --import-method web-download \ --stores central,dcn1
この例では、qcow2 cirros イメージが公式の Cirros サイトからダウンロードされ、glance により RAW に変換され、
--stores
パラメーターで指定した中央サイトおよびエッジサイト 1 にインポートされます。
あるいは、--stores
を --all-stores True
に置き換えて、すべてのストアにイメージをアップロードすることができます。
A.1.3. 新規サイトへのイメージのコピー
既存のイメージを中央サイトからエッジサイトにコピーすることができます。これにより、新たに構築されたサイトにおいて、以前作成したイメージにアクセスすることができます。
コピーの操作には、glance イメージの UUID を使用します。
ID=$(openstack image show cirros -c id -f value) glance image-import $ID --stores dcn0,dcn1 --import-method copy-image
注記この例では、
--stores
オプションにより、cirros
イメージを中央サイトからエッジサイト dcn1 および dcn2 にコピーすることを指定しています。あるいは、--all-stores True
オプションを使用して、現在イメージがアップロードされていないすべてのストアにイメージをアップロードすることができます。イメージが各ストアにコピーされていることを確認します。
stores
キー (属性マッピングの最後の項目) がcentral,dcn0,dcn1
に設定されている点に注意してください。$ openstack image show $ID | grep properties | properties | direct_url=rbd://d25504ce-459f-432d-b6fa-79854d786f2b/images/8083c7e7-32d8-4f7a-b1da-0ed7884f1076/snap, locations=[{u'url: u'rbd://d25504ce-459f-432d-b6fa-79854d786f2b/images/8083c7e7-32d8-4f7a-b1da-0ed7884f1076/snap', u'metadata': {u'store': u'central'}}, {u'url': u'rbd://0c10d6b5-a455-4c4d-bd53-8f2b9357c3c7/images/8083c7e7-32d8-4f7a-b1da-0ed7884f1076/snap', u'metadata': {u'store': u'dcn0'}}, {u'url': u'rbd://8649d6c3-dcb3-4aae-8c19-8c2fe5a853ac/images/8083c7e7-32d8-4f7a-b1da-0ed7884f1076/snap', u'metadata': {u'store': u'dcn1'}}], os_glance_failed_import=', os_glance_importing_to_stores=', os_hash_algo='sha512, os_hash_value=b795f047a1b10ba0b7c95b43b2a481a59289dc4cf2e49845e60b194a911819d3ada03767bbba4143b44c93fd7f66c96c5a621e28dff51d1196dae64974ce240e, os_hidden=False, stores=central,dcn0,dcn1 |
中央サイトにイメージを使用する仮想マシンがない場合でも、必ず中央サイトにイメージのコピーを保存してください。
A.1.4. エッジサイトのインスタンスがイメージベースのボリュームからブートできることの確認
エッジサイトでイメージを使用して、永続ルートボリュームを作成することができます。
手順
ボリュームとして作成するイメージの ID を把握し、その ID を
openstack volume create
コマンドに渡します。IMG_ID=$(openstack image show cirros -c id -f value) openstack volume create --size 8 --availability-zone dcn0 pet-volume-dcn0 --image $IMG_ID
新たに作成したボリュームのボリューム ID を把握し、それを
openstack server create
コマンドに渡します。VOL_ID=$(openstack volume show -f value -c id pet-volume-dcn0) openstack server create --flavor tiny --key-name dcn0-key --network dcn0-network --security-group basic --availability-zone dcn0 --volume $VOL_ID pet-server-dcn0
dcn0 エッジサイトの ceph-mon コンテナー内で rbd コマンドを実行してボリュームプールのリストを表示し、ボリュームがイメージベースであることを確認できます。
$ sudo podman exec ceph-mon-$HOSTNAME rbd --cluster dcn0 -p volumes ls -l NAME SIZE PARENT FMT PROT LOCK volume-28c6fc32-047b-4306-ad2d-de2be02716b7 8 GiB images/8083c7e7-32d8-4f7a-b1da-0ed7884f1076@snap 2 excl $
インスタンスのルートボリュームの cinder スナップショットを作成できることを確認します。クリーンなスナップショットを作成するために、サーバーを停止してデータが休止状態になるようにします。インスタンスが停止している場合ボリュームのステータスは
in-use
のままなので、--force オプションを使用します。openstack server stop pet-server-dcn0 openstack volume snapshot create pet-volume-dcn0-snap --volume $VOL_ID --force openstack server start pet-server-dcn0
dcn0 Ceph クラスターのボリュームプールの内容をリスト表示し、新たに作成したスナップショットを表示します。
$ sudo podman exec ceph-mon-$HOSTNAME rbd --cluster dcn0 -p volumes ls -l NAME SIZE PARENT FMT PROT LOCK volume-28c6fc32-047b-4306-ad2d-de2be02716b7 8 GiB images/8083c7e7-32d8-4f7a-b1da-0ed7884f1076@snap 2 excl volume-28c6fc32-047b-4306-ad2d-de2be02716b7@snapshot-a1ca8602-6819-45b4-a228-b4cd3e5adf60 8 GiB images/8083c7e7-32d8-4f7a-b1da-0ed7884f1076@snap 2 yes
A.1.5. イメージのスナップショットを作成しサイト間でコピーできることの確認
dcn0 サイトで新規イメージを作成できることを確認します。クリーンなスナップショットを作成するために、サーバーを停止してデータが休止状態になるようにします。
NOVA_ID=$(openstack server show pet-server-dcn0 -f value -c id) openstack server stop $NOVA_ID openstack server image create --name cirros-snapshot $NOVA_ID openstack server start $NOVA_ID
dcn0
エッジサイトから glance のデフォルトバックエンドであるハブサイトに、イメージをコピーして戻します。IMAGE_ID=$(openstack image show cirros-snapshot -f value -c id) glance image-import $IMAGE_ID --stores central --import-method copy-image
glance マルチストア操作の詳細については、Image service with multiple stores を参照してください。
A.2. スパイン/リーフ型デプロイメントへの移行
既存ネットワーク設定の既存クラウドを、スパイン/リーフ型アーキテクチャーのクラウドに移行することができます。そのためには、以下の条件が満たされている必要があります。
-
すべてのベアメタルポートで、
physical-network
属性の値がctlplane
に設定されている。 -
undercloud.conf に追加されたパラメーター
enable_routed_networks
がtrue
に設定され、続いてアンダークラウドのインストールコマンドopenstack undercloud install
が再実行される。
アンダークラウドが再デプロイされると、オーバークラウドは 1 つのリーフ leaf0
が設定されたスパイン/リーフとみなされます。以下の手順で、さらにプロビジョニングリーフをデプロイメントに追加することができます。
- Configuring routed spine-leaf in the undercloud に示すように、必要なサブネットを undercloud.conf に追加します。
-
アンダークラウドのインストールコマンド
openstack undercloud install
を再実行します。 必要なネットワークおよびロールを、それぞれオーバークラウドのテンプレート
network_data.yaml
およびroles_data.yaml
にさらに追加します。注記ネットワーク設定ファイルで
{{network.name}}InterfaceRoutes
パラメーターを使用している場合は、NetworkDeploymentActions
パラメーターに UPDATE の値が含まれるようにする必要があります。NetworkDeploymentActions: ['CREATE','UPDATE'])
- 最後に、クラウドデプロイメントに該当するすべての heat テンプレートが含まれるオーバークラウドのインストールスクリプトを再実行します。
A.3. マルチスタックデプロイメントへの移行
既存のデプロイメントを中央サイトとして扱い、さらにエッジサイトを追加して、単一スタックのデプロイメントからマルチスタックのデプロイメントに移行することができます。
単一スタックからマルチスタックに移行する機能は、本リリースでは テクノロジープレビュー であるため、Red Hat では全面的にはサポートしていません。これは、テスト用途にのみご利用いただく機能で、実稼働環境にデプロイすべきではありません。テクノロジープレビュー機能についての詳しい情報は、対象範囲の詳細 を参照してください。
既存のスタックを分割することはできません。必要に応じて、既存のスタックをスケールダウンしてコンピュートノードを削除することができます。その後、これらのコンピュートノードをエッジサイトに追加することができます。
すべてのコンピュートノードが削除されると、このアクションによりワークロードが中断します。
A.4. エッジサイト間のバックアップおよびリストア
エッジサイトの分散コンピュートノード (DCN) アーキテクチャーおよびアベイラビリティーゾーン間で、Block Storage サービス (cinder) ボリュームをバックアップしてリストアすることができます。cinder-backup
サービスは中央のアベイラビリティーゾーン (AZ) で実行され、バックアップは中央の AZ に保存されます。Block Storage サービスは、DCN サイトにバックアップを保存しません。
前提条件
-
中央サイトが、
/usr/share/openstack-tripleo-heat-templates/environments
にあるcinder-backup.yaml
環境ファイルでデプロイされている。詳しくは、Block Storage backup service deployment を参照してください。 - Block Storage サービス (cinder) CLI が利用できる。
-
すべてのサイトは共通の
openstack
cephx クライアント名を使用する必要があります。詳細は、外部アクセス用 Ceph キーの作成 を参照してください。
手順
最初の DCN サイトのボリュームのバックアップを作成します。
$ cinder --os-volume-api-version 3.51 backup-create --name <volume_backup> --availability-zone <az_central> <edge_volume>
-
<volume_backup>
をボリュームバックアップの名前に置き換えます。 -
<az_central>
を、cinder-backup
サービスをホストする中央アベイラビリティーゾーンの名前に置き換えます。 <edge_volume>
をバックアップするボリュームの名前に置き換えます。注記Ceph キーリングに問題がある場合には、
cinder-backup
コンテナーを再起動して、キーリングがホストからコンテナーに正常にコピーされるようにする必要がある場合があります。
-
2 番目の DCN サイトの新規ボリュームにバックアップを復元します。
$ cinder --os-volume-api-version 3.51 create --availability-zone <az_2> --name <new_volume> --backup-id <volume_backup> <volume_size>
-
<az_2>
を、バックアップを復元するアベイラビリティーゾーンの名前に置き換えます。 -
<new_volume>
を新規ボリュームの名前に置き換えます。 -
<volume_backup>
を、前のステップで作成したボリュームバックアップの名前に置き換えます。 -
<volume_size>
を、元のボリュームのサイズと同じまたはそれ以上の値に置き換えます (GB 単位)。
-
A.5. DCN サイトの削除
エッジサイトを削除するには、Red Hat OpenStack デプロイメントからスタック、ストレージ、および関連サービスを削除します。以下の例では、dcn2 が廃止され、DCN (分散コンピュートノード) デプロイメントから削除されます。ご使用の環境に応じてコマンドを調整します。
前提条件
- 完全にデプロイされた DCN アーキテクチャーの Red Hat OpenStack Platform クラスターの一部である、廃止するサイトがある。
- 削除するエッジサイトでアクティブなインスタンスをすべて削除する必要があります。
- 削除するエッジサイトでアクティブなボリュームをすべて削除する必要があります。
手順
このサイトが Red Hat Ceph Storage と共にプロビジョニングされている場合は、まず削除するエッジサイトに関連付けられた glance ストア、Ceph 設定、および関連するパーミッションを削除する必要があります。エッジサイトにストレージをデプロイしていない場合は、手順 2 に進みます。
Red Hat Openstack Platform director にログインし、source コマンドで中央サイトの RC 認証情報ファイルを読み込みます。
source /home/stack/centralrc
スタックに関連付けられたすべてのイメージを削除します。
glance stores-delete --store dcn2 <IMAGE>
<_IMAGE_> を、削除するイメージの名前に置き換えます。
dcn_ceph_external.yaml
ファイルからスタックに関連付けられたスタンザを削除します。以下の例では、dcn2
設定を削除します。... - cluster: "dcn1" fsid: "e70c3c80-4eca-4f1a-8cbb-3e9753b401c9" external_cluster_mon_ips: "172.23.2.58, 172.23.2.153, 172.23.2.32" keys: - name: "client.external" caps: mgr: "allow *" mon: "profile rbd" osd: "profile rbd pool=vms, profile rbd pool=volumes, profile rbd pool=images" key: "AQD4Ae9gAAAAABAAeeG5N0E3Jka7bXRDhB8CtQ==" mode: "0600" dashboard_enabled: false ceph_conf_overrides: client: keyring: /etc/ceph/dcn1.client.external.keyring - - cluster: "dcn2" - fsid: "c699978c-876d-4c65-984f-2179d22244ea" - external_cluster_mon_ips: "172.23.3.239, 172.23.3.99, 172.23.3.67" - keys: - - name: "client.external" - caps: - mgr: "allow *" - mon: "profile rbd" - osd: "profile rbd pool=vms, profile rbd pool=volumes, profile rbd pool=images" - key: "AQA1Du9gAAAAABAAMOBAczLIw1SzBR7vxwYqJg==" - mode: "0600" - dashboard_enabled: false - ceph_conf_overrides: - client: - keyring: /etc/ceph/dcn2.client.external.keyring
glance_update.yaml
ファイルからスタックに関連付けられたスタンザを削除します。以下の例では、dcn2
設定を削除します。parameter_defaults: GlanceMultistoreConfig: dcn0: GlanceBackend: rbd GlanceStoreDescription: 'dcn0 rbd glance store' CephClientUserName: 'openstack' CephClusterName: dcn0 dcn1: GlanceBackend: rbd GlanceStoreDescription: 'dcn1 rbd glance store' CephClientUserName: 'openstack' CephClusterName: dcn1 - dcn2: - GlanceBackend: rbd - GlanceStoreDescription: 'dcn2 rbd glance store' - CephClientUserName: 'openstack' - CephClusterName: dcn2
削除するスタックに関連する /etc/ceph 内のファイルを削除します。各コントローラーノードでこのステップを実行します。
source /home/stack/stackrc for i in $(openstack server list | awk '/controller/ {print $8}' | cut -d= -f2); do ssh heat-admin@${i} sudo -E \ rm -f /etc/ceph/dcn2.conf /etc/ceph/dcn2.client.openstack.keyring done
スタックの cinder-volume サービスを無効にします。
削除するスタックの
cinder-volume
サービスを特定します。source /home/stack/centralrc VOLUME_HOST=openstack volume service list --service cinder-volume
cinder-volume サービスを無効にします。
openstack volume service set --disable ${VOLUME_HOST} cinder-volume
中央サイトのコントローラーノードのいずれか上にある cinder_api コンテナーから、
cinder-volume
サービスを削除します。ssh heat-admin@CONTROLLER_IP sudo podman exec cinder_api cinder-manage service remove cinder-volume ${VOLUME_HOST}
OVS を使用する場合は、削除したスタックの neutron エージェントをクリーンアップします。
ネットワークエージェントの UUID を特定します。
source /home/stack/centralrc openstack network agent list
前の手順で取得した UUID を使用して、削除するネットワークエージェントを特定します。UUID ごとに以下のコマンドを実行します。
openstack network agent delete $UUID
注記OVN エージェントは削除できません。
スタックに関連付けられた Compute サービスを削除します。
dcn2 に関連付けられた Compute サービスの ID を検索します。この手順では、一意のホスト名を使用できます。ホスト名に stacknames が含まれる場合は、
grep
を使用して、削除する Compute サービスのみをリスト表示できます。source /home/stack/centralrc openstack compute service list | grep dcn2
最初のフィールドに表示される ID を使用して、Compute サービスを削除します。ID ごとに以下のコマンドを実行します。
openstack compute service delete <ID>
サイトに関連付けられたホストアグリゲートを削除します。
source /home/stack/centralrc openstack aggregate delete dcn2
/home/stack/central/network/network_data.yaml
ファイルから削除するスタックのサブネットを削除します。- name: Tenant name_lower: tenant vip: false # Tenant network does not use VIPs vlan: 1189 ip_subnet: '172.19.1.0/24' allocation_pools: [{'start': '172.19.1.4', 'end': '172.19.1.250'}] gateway_ip: '172.19.1.254' subnets: tenant_leaf1: vlan: 1179 ip_subnet: '172.19.2.0/24' allocation_pools: [{'start': '172.19.2.4', 'end': '172.19.2.250'}] gateway_ip: '172.19.2.254' - tenant_leaf2: - vlan: 1169 - ip_subnet: '172.19.3.0/24' - allocation_pools: [{'start': '172.19.3.4', 'end': '172.19.3.250'}] - gateway_ip: '172.19.3.254
スタックを削除します。
source /home/stack/stackrc openstack overcloud delete -y dcn2
(オプション) 廃止したサイトからベアメタルノードを削除します。
ノードをリスト表示し、削除されたスタック dcn2 に関連付けられたノードを特定します。
source /home/stack/stackrc openstack baremetal node list
直前の手順のノードの UUID を使用して、各ノードを ironic から削除します。
openstack baremetal node delete $UUID