RHEL 6 で Waiting for quorum... Timed-out waiting for cluster メッセージが発生すると cman が失敗し、Shutdown request received during init メッセージがログに出力される
Issue
-
3 ノードクラスターの起動シーケンスでノードが 1 つだけ起動すると、定足数デバイスが登録され、すぐに登録が解除されます。その結果、単一ノードでクラスターサービスを起動することができません。
-
定足数デバイスがあるとクラスターが起動できません。
Starting cluster:
Checking if cluster has been disabled at boot... [ OK ]
Checking Network Manager... [ OK ]
Global setup... [ OK ]
Loading kernel modules... [ OK ]
Mounting configfs... [ OK ]
Starting cman... [ OK ]
Starting qdiskd... [ OK ]
Waiting for quorum...Timed-out waiting for cluster
[FAILED]
qdiskdログに以下が出力されます。
Sep 06 14:23:30 qdiskd Node 3 is UP
Sep 06 14:23:35 qdiskd Node 3 is the master
Sep 06 14:23:50 qdiskd Shutdown request received during initialization
-
/var/log/messagesには、定足数が登録されたことが確認できますが、その後登録が解除され、corosyncサービスエンジンがロードされなくなります。corosync[28029]: [CMAN ] quorum device registered qdiskd[28079]: Initial score 5/5 qdiskd[28079]: Initialization complete qdiskd[28079]: Score sufficient for master operation (5/5; required=3); upgrading qdiskd[28079]: Unregistering quorum device. corosync[28029]: [CMAN ] quorum device unregistered corosync[28029]: [SERV ] Unloading all Corosync service engines. -
ノード 3 は起動していますが、ノード 1 とノード 2 がダウンしたあと、ノード 1 もノード 2 もクラスターに戻ることができません。
Environment
- Red Hat Enterprise Linux (RHEL) 6 (および High Availability アドオン)
- クォーラムデバイスを使用してクラスターを設定している (
/etc/cluster/cluster.confの<quorumd>) - 以下のいずれかの理由で、quorum-device 投票がない定足数を起動したノードが取得できない
- 定足数デバイスの投票が定足数に必要な分をまかなえるように、
expected_votesが設定されている - 定足数デバイスの投票と、ノードの投票が定足数に対して十分でなく、ノードが足りない
- 定足数デバイスの投票が定足数に必要な分をまかなえるように、
Subscriber exclusive content
A Red Hat subscription provides unlimited access to our knowledgebase of over 48,000 articles and solutions.
Welcome! Check out the Getting Started with Red Hat page for quick tours and guides for common tasks.
