RHEL クラスターのネットワークに問題が発生していないのにも関わらず、ping を使用した QDisk ヒューリスティックがタイムアウトになります
Issue
- デフォルトゲートウェイを ping する
heuristicを持つQDiskを使用しているクラスターがあります。このheuristicは断続的にタイムアウトになりますが、問題が発生したときに別のネットワークの問題 (トークン紛失) は発生していないようです。 heuristicはどのタイムアウト値を使用していますか? タイムアウトしたときにログで報告されている時間量が、heuristicの tko*interval 値に一致しません。- 以下のフォームの ping ヒューリスティックがあり、
/var/log/messagesにヒューリスティックのタイムアウトが表示され、クラスターノードが退いてフェンスされる場合があります。
<heuristic interval="2" program="ping -c1 -t1 192.168.2.1" score="1" tko="3"/>
Oct 4 00:15:12 node1 qdiskd[6854]:<info> Heuristic:'ping -c1 -t1 192.168.2.1' DOWN - Exceeded timeout of 9 seconds
Oct 4 00:15:12 node1 qdiskd[6854]:<notice> Score insufficient for master operation (0/1; required=1); downgrading
- クラスターサービスがフェイルオーバーし、
heuristicを設定した qdisk を持つ 2 つのノードクラスターでノードが予想外に再起動します。qdiskd メッセージがログに記録されています。何が GFS2 クラスターをクラッシュさせていますか?
Environment
- Red Hat Cluster Suite 4 以降
- Red Hat Enterprise Linux Server 5 (および High Availability アドオン)
- Red Hat Enterprise Linux Server 6 (および High Availability アドオン)
- QDisk および ping ヒューリスティックを使用したクラスター設定
- ヒューリスティックは
pingで-wオプションを使用しません。
- ヒューリスティックは
Subscriber exclusive content
A Red Hat subscription provides unlimited access to our knowledgebase of over 48,000 articles and solutions.
Welcome! Check out the Getting Started with Red Hat page for quick tours and guides for common tasks.
