RHEL High Availability クラスターで Pacemaker を使用した場合、stonith デバイスが起動に失敗したり、"Timed Out" を報告したりする
Issue
pcs statusコマンドで、1 つ以上の stonith デバイスの"Timed Out"エラーが表示されます。
fence_node1_start_0 on node2.example.com 'unknown error' (1): call=48, status=Timed Out, last-rc-change='Fri Sep 5 15:50:46 2014', queued=21022ms, exec=0ms
- stonith デバイスのモニターまたは起動操作がタイムアウトになり、以下に示すようなエラーが報告されます。
Jun 01 11:36:07 node1.example.com crmd[2807]: notice: process_lrm_event: Operation fence_node_5356_monitor_0: not running (node=node1.example.com, call=311, rc=7, cib-upda...nfirmed=true)
Jun 01 11:36:27 node1.example.com stonith-ng[2803]: notice: stonith_action_async_done: Child process 3114 performing action 'monitor' timed out with signal 15
Jun 01 11:36:27 node1.example.com stonith-ng[2803]: notice: log_operation: Operation 'monitor' [3114] for device 'fence_node2' returned: -62 (Timer expired)
Jun 01 11:36:28 node1.example.com crmd[2807]: error: process_lrm_event: Operation fence_node_node2_start_0: Timed Out (node=node1.example.com, call=312, timeout=20000ms)
- stonith デバイスは、
"Timed Out"エラーが発生してStopped状態のままになります。
Environment
- Red Hat Enterprise Linux 6、7、または 8 (High Availability アドオン使用)
- Pacemaker
Subscriber exclusive content
A Red Hat subscription provides unlimited access to our knowledgebase, tools, and much more.