RHEL クラスターのネットワークに問題が発生していないのにも関わらず、ping を使用した QDisk ヒューリスティックがタイムアウトになります

Solution Verified - Updated -

Issue

  • デフォルトゲートウェイを ping する heuristic を持つ QDisk を使用しているクラスターがあります。この heuristic は断続的にタイムアウトになりますが、問題が発生したときに別のネットワークの問題 (トークン紛失) は発生していないようです。
  • heuristic はどのタイムアウト値を使用していますか? タイムアウトしたときにログで報告されている時間量が、heuristictko*interval 値に一致しません。
  • 以下のフォームの ping ヒューリスティックがあり、/var/log/messages にヒューリスティックのタイムアウトが表示され、クラスターノードが退いてフェンスされる場合があります。
<heuristic interval="2" program="ping -c1 -t1 192.168.2.1" score="1" tko="3"/>

Oct  4 00:15:12 node1 qdiskd[6854]:<info> Heuristic:'ping -c1 -t1 192.168.2.1' DOWN - Exceeded timeout of 9 seconds
Oct  4 00:15:12 node1 qdiskd[6854]:<notice> Score insufficient for master operation (0/1; required=1); downgrading
  • クラスターサービスがフェイルオーバーし、heuristic を設定した qdisk を持つ 2 つのノードクラスターでノードが予想外に再起動します。qdiskd メッセージがログに記録されています。何が GFS2 クラスターをクラッシュさせていますか?

Environment

  • Red Hat Cluster Suite 4 以降
  • Red Hat Enterprise Linux Server 5 (および High Availability アドオン)
  • Red Hat Enterprise Linux Server 6 (および High Availability アドオン)
  • QDisk および ping ヒューリスティックを使用したクラスター設定
    • ヒューリスティックは ping-w オプションを使用しません

Subscriber exclusive content

A Red Hat subscription provides unlimited access to our knowledgebase of over 48,000 articles and solutions.

Current Customers and Partners

Log in for full access

Log In
Close

Welcome! Check out the Getting Started with Red Hat page for quick tours and guides for common tasks.