4.3. GFS2 ファイルシステムがハングし、全ノードのリブートが必要

ご使用の GFS2 ファイルシステムがハングし、それに対して実行したコマンドを返さず、使用できる状態にするにはクラスター内の全ノードをリブートする必要がある場合、以下の問題を確認してください。
  • フェンスに障害が発生している可能性があります。GFS2 ファイルシステムがフリーズし、障害が発生したフェンスのイベントのデータ整合性が確保されます。メッセージログを確認し、ハング時にフェンスに障害が発生していたかどうかを調べます。フェンスが正しく設定されているかどうかも確認します。
  • GFS2 ファイルシステムが無効な状態 (withdraw エラー) である可能性があります。メッセージログで withdraw という単語があるか調べ、ファイルシステムが無効な状態 (withdraw エラー) であることを示す GFS2 からのメッセージおよびコールトレースの有無を確認します。この状態は、ファイルシステムの破損、ストレージの障害、またはバグがあることを示しています。ファイルシステムを再び稼動させるために、ファイルシステムをアンマウントして、gfs2-utils パッケージを更新し、fsck コマンドをファイルシステム上で実行します。Red Hat サポートでサポートチケットを開き、GFS2 が無効な状態 (withdraw エラー) であることを伝え、ログと、sosreports コマンドで生成されたデバッグ情報を提供します。
  • ロック関連の問題が発生したかバグの可能性があります。問題の発生中にデータを収集し、「GFS2 ファイルシステムがハングし、単一ノードのリブートが必要」 で説明されたように Red Hat サポートのチケットを作成してください。