RHEL 6 で Waiting for quorum... Timed-out waiting for cluster メッセージが発生すると cman が失敗し、Shutdown request received during init メッセージがログに出力される
Issue
-
3 ノードクラスターの起動シーケンスでノードが 1 つだけ起動すると、定足数デバイスが登録され、すぐに登録が解除されます。その結果、単一ノードでクラスターサービスを起動することができません。
-
定足数デバイスがあるとクラスターが起動できません。
Starting cluster:
Checking if cluster has been disabled at boot... [ OK ]
Checking Network Manager... [ OK ]
Global setup... [ OK ]
Loading kernel modules... [ OK ]
Mounting configfs... [ OK ]
Starting cman... [ OK ]
Starting qdiskd... [ OK ]
Waiting for quorum...Timed-out waiting for cluster
[FAILED]
qdiskdログに以下が出力されます。
Sep 06 14:23:30 qdiskd Node 3 is UP
Sep 06 14:23:35 qdiskd Node 3 is the master
Sep 06 14:23:50 qdiskd Shutdown request received during initialization
-
/var/log/messagesには、定足数が登録されたことが確認できますが、その後登録が解除され、corosyncサービスエンジンがロードされなくなります。corosync[28029]: [CMAN ] quorum device registered qdiskd[28079]: Initial score 5/5 qdiskd[28079]: Initialization complete qdiskd[28079]: Score sufficient for master operation (5/5; required=3); upgrading qdiskd[28079]: Unregistering quorum device. corosync[28029]: [CMAN ] quorum device unregistered corosync[28029]: [SERV ] Unloading all Corosync service engines. -
ノード 3 は起動していますが、ノード 1 とノード 2 がダウンしたあと、ノード 1 もノード 2 もクラスターに戻ることができません。
Environment
- Red Hat Enterprise Linux (RHEL) 6 (および High Availability アドオン)
- クォーラムデバイスを使用してクラスターを設定している (
/etc/cluster/cluster.confの<quorumd>) - 以下のいずれかの理由で、quorum-device 投票がない定足数を起動したノードが取得できない
- 定足数デバイスの投票が定足数に必要な分をまかなえるように、
expected_votesが設定されている - 定足数デバイスの投票と、ノードの投票が定足数に対して十分でなく、ノードが足りない
- 定足数デバイスの投票が定足数に必要な分をまかなえるように、
Subscriber exclusive content
A Red Hat subscription provides unlimited access to our knowledgebase, tools, and much more.