RHEL クラスターのネットワークに問題が発生していないのにも関わらず、ping を使用した QDisk ヒューリスティックがタイムアウトになります
Issue
- デフォルトゲートウェイを ping する
heuristicを持つQDiskを使用しているクラスターがあります。このheuristicは断続的にタイムアウトになりますが、問題が発生したときに別のネットワークの問題 (トークン紛失) は発生していないようです。 heuristicはどのタイムアウト値を使用していますか? タイムアウトしたときにログで報告されている時間量が、heuristicの tko*interval 値に一致しません。- 以下のフォームの ping ヒューリスティックがあり、
/var/log/messagesにヒューリスティックのタイムアウトが表示され、クラスターノードが退いてフェンスされる場合があります。
<heuristic interval="2" program="ping -c1 -t1 192.168.2.1" score="1" tko="3"/>
Oct 4 00:15:12 node1 qdiskd[6854]:<info> Heuristic:'ping -c1 -t1 192.168.2.1' DOWN - Exceeded timeout of 9 seconds
Oct 4 00:15:12 node1 qdiskd[6854]:<notice> Score insufficient for master operation (0/1; required=1); downgrading
- クラスターサービスがフェイルオーバーし、
heuristicを設定した qdisk を持つ 2 つのノードクラスターでノードが予想外に再起動します。qdiskd メッセージがログに記録されています。何が GFS2 クラスターをクラッシュさせていますか?
Environment
- Red Hat Cluster Suite 4 以降
- Red Hat Enterprise Linux Server 5 (および High Availability アドオン)
- Red Hat Enterprise Linux Server 6 (および High Availability アドオン)
- QDisk および ping ヒューリスティックを使用したクラスター設定
- ヒューリスティックは
pingで-wオプションを使用しません。
- ヒューリスティックは
Subscriber exclusive content
A Red Hat subscription provides unlimited access to our knowledgebase, tools, and much more.