9.5. クラスターサービスがハングする

クラスターサービスがノードのフェンスを試みる場合、クラスターサービスはフェンス動作が正しく完了するまで停止しています。そのため、クラスターが制御するストレージ、又はサービスがハングして、クラスターノードが異なるクラスターメンバーシップを表示する場合、あるいはノードのフェンスを試行する時にクラスターがハングして、ノードを再起動して復元する必要がある場合には、以下の状況をチェックしてください。
  • クラスターがノードのフェンスを試行して、フェンス動作が失敗した可能性があります。
  • 全てのノード上で /var/log/messages ファイルを検証して、フェンス障害のメッセージがあるかどうかチェックします。もしあれば、クラスター内のノード群を再起動して、フェンシングを正しく設定します。
  • 「2 ノードクラスターの各ノードが片方のノードの停止を報告する」 の説明のように、ネットワークパーティションが発生しなかったことを確認します。また、ノード間の通信が引き続き可能であり、ネットワークが有効であることを確認します。
  • 一部のノードがクラスターから離脱すると、残りのノード群は定足数に足りなくなる場合があります。クラスターは機能するために定足数が必要です。ノードが削除されてクラスターが定足数を満たさなくなると、サービスとストレージはハングします。期待投票数を調節するか、必要な数のノードをクラスターに戻します。

注記

fence_node コマンド又は Conga を使用して手動でノードをフェンスすることができます。詳細は fence_node の man ページ及び 「ノードのクラスターに対する離脱/参加」 を参照してください。