pacemaker を使用する RHEL High Availability クラスターに exclusive=true に設定すると LVM リソースが失敗し、timed out after 30000ms が発生する
Issue
- ファイルシステムに大規模なコピーを行うと、
LVMリソースの監視オペレーションが頻繁にタイムアウトになります。 LVMリソースがその監視に失敗し続けます。LVMリソースが失敗すると、リソースグループが別のノードにフェイルオーバーします。pacemakerHA-LVM エージェント監視オペレーションが失敗します。
Jun 4 14:17:47 node1 lrmd[6514]:warning: child_timeout_callback: myVG_monitor_10000 process (PID 40301) timed out
Jun 4 14:17:47 node1 lrmd[6514]:warning: operation_finished: myVG_monitor_10000:40301 - timed out after 30000ms
Jun 4 14:17:47 node1 crmd[6517]: error: process_lrm_event:Operation myVG_monitor_10000:Timed Out (node=node1.example.com call=141, timeout=30000ms)
- マルチパスデバイスを使用する
LVMリソースが作成されますが、マルチパスデバイスへのサブパスがほとんどない状態で変動が発生すると、pacemaker が LVM モニターを即座にタイムアウトします。マルチパスデバイスには未だにサブパスの半分しかアクティブにしていないため、pacemaker の LVM モニターが失敗したりタイムアウトになるはずはありません。
Environment
- Red Hat Enterprise Linux (RHEL) 6 または 7 (および High Availability アドオン)
pacemakerexclusive=true属性になっている CIB にある 1 つ以上のLVMリソース
Subscriber exclusive content
A Red Hat subscription provides unlimited access to our knowledgebase, tools, and much more.