Red Hat Training

A Red Hat training course is available for RHEL 8

18.7. ノードのヘルスストラテジーの設定

ノードは、そのクラスターメンバーシップを維持するためには十分に機能していても、別の側面では正常に機能しておらず、リソースにとって適切ではないロケーションになることがあります。たとえば、ディスクドライブが SMART エラーを報告していたり、CPU の負荷が高くなっている場合などがそうです。RHEL 8.7 では、Pacemaker のノードヘルスストラテジーを使用して、自動的にリソースを正常でないノードから移動できます。

次のヘルスノードリソースエージェントを使用して、ノードのヘルスを監視できます。このエージェントは、CPU とディスクのステータスに基づいてノードの属性を設定します。

  • ocf:pacemaker:HealthCPU: CPU のアイドリングを監視
  • ocf:pacemaker:HealthIOWait: CPU I/O 待機を監視
  • ocf:pacemaker:HealthSMART: ディスクドライブの SMART ステータスを監視
  • ocf:pacemaker:SysInfo: ローカルシステム情報を使用してさまざまなノード属性を設定し、ディスク領域の使用状況を監視するヘルスエージェントとしても機能

さらに、すべてのリソースエージェントがヘルスノードストラテジーの定義に使用できるノード属性を提供する可能性があります。

手順

次の手順では、CPU I/O 待機が 15% を超えるノードからリソースを移動するクラスターのヘルスノードストラテジーを設定します。

  1. health-node-strategy クラスタープロパティーを設定して、Pacemaker がノードヘルスの変化に応答する方法を定義します。

    # pcs property set node-health-strategy=migrate-on-red
  2. ヘルスノードリソースエージェントを使用するクラスターリソースのクローンを作成し、allow-unhealthy-nodes リソースメタオプションを設定して、ノードのヘルスが回復したかどうかをクラスターが検出してリソースをノードに戻すかどうかを定義します。すべてのノードのヘルスを継続的にチェックするには、定期的な監視アクションを使用してこのリソースを設定します。

    この例では、HealthIOWait リソースエージェントを作成して CPU I/O 待機を監視し、ノードからリソースを移動するための制限を 15% に設定します。このコマンドは、allow-unhealthy-nodes リソースメタオプションを true に設定し、繰り返しの監視間隔を 10 秒に設定します。

    # pcs resource create io-monitor ocf:pacemaker:HealthIOWait red_limit=15 op monitor interval=10s meta allow-unhealthy-nodes=true clone