RHEL 7、8、9 の高可用性クラスターで、systemd がグレースフルシャットダウンを開始するため、フェンシングが失敗する
Issue
systemd-logindが "電源ボタン" 信号を処理し、システムのパワーサイクルの代わりに、グレースフルシャットダウンを開始するため、フェンシングが失敗します。- あるノードが他のノードをフェンスすると、そのノードは電源ボタンの押下を処理し、シャットダウンを開始します。 その間、他のノードでフェンシングが失敗します。時間がかかりすぎていることが原因のようです。
- 以前のリリースと同様に、RHEL 7 クラスターで acpi / acpid を無効にする必要がありますか?
- ソフトシャットダウンを回避するために、RHEL 7 クラスターノードで ACPI を無効にする以外に何か行う必要がありますか?例:
Aug 13 21:07:22 node01 systemd-logind: Power key pressed.
Aug 13 21:07:22 node01 systemd-logind: Powering Off...
Aug 13 21:07:22 node01 systemd-logind: System is powering down.
Aug 13 21:07:42 node02 stonith-ng[2803]: notice: log_operation: Operation 'reboot' [3114] for device 'node01-ilo' returned: -62 (Timer expired)
- RHEL 7 で、クラスターノードが強制終了せず、グレースフルに再起動しました。
Nov 2 10:57:01 node41 stonith-ng[8161]: notice: Operation reboot of node42 by node42 for crmd.20238@uxplpsgrd03.8b66209c: OK
Nov 2 10:57:01 node42 crmd[20238]: crit: We were allegedly just fenced by node41 for node42!
Nov 2 10:57:01 node42 stonith-ng[20234]: notice: Operation reboot of node42 by node41 for crmd.20238@node42.8b66209c: OK
Nov 2 10:57:01 node42 systemd-logind: Power key pressed.
- RHEL 8 で、クラスターノードが強制終了せず、グレースフルに再起動しました。
Sep 18 16:19:11 rhel8-1 stonith-ng[8161]: notice: Operation reboot of rhel8-1 by rhel8-2 for crmd.20238@uxplpsgrd03.8b66209c: OK
Sep 18 16:19:11 rhel8-1 crmd[20238]: crit: We were allegedly just fenced by rhel8-1 for rhel8-2!
Sep 18 16:19:11 rhel8-1 systemd-logind[792]: Session 1 logged out. Waiting for processes to exit.
Sep 18 16:19:11 rhel8-1 systemd-logind[792]: Removed session 1.
Environment
- Red Hat Enterprise Linux (RHEL) 7、8、9 (High Availability アドオン使用)
- 1 つ以上の pacemaker クラスターノード (または pacemaker リモートノード) が、BMC またはシステム管理コントローラー (iLO、RSA、DRAC、iDRAC など) に接続する電源方式を使用する stonith デバイスに関連付けられている
Subscriber exclusive content
A Red Hat subscription provides unlimited access to our knowledgebase, tools, and much more.