Pacemaker を備えた RHEL High Availability クラスターでリソースが適切に実行されているはずであるにもかかわらず、リソース監視操作が失敗し、lrmd が "timed out after X ms" を報告する
Issue
- クラスター内でリソース操作がタイムアウトになっていますが、その時点までアプリケーションは正常に実行されているようです。
- 監視操作がタイムアウトになった理由は?
- クラスター内における監視操作のタイムアウトの診断方法は?
Apr 29 10:43:59 node1.example.com lrmd[3598]: warning: rabbitmq-server_monitor_10000 process (PID 44052) timed out
Apr 29 10:43:59 node1.example.com lrmd[3598]: warning: rabbitmq-server_monitor_10000:44052 - timed out after 40000ms
Apr 29 10:43:59 node1.example.com crmd[3605]: error: Operation rabbitmq-server_monitor_10000: Timed Out (node=node1, call=1682, timeout=40000ms)
Environment
- Red Hat Enterprise Linux (RHEL) 6、7、8、9 (High Availability Add-On 使用)
pacemaker
Subscriber exclusive content
A Red Hat subscription provides unlimited access to our knowledgebase, tools, and much more.