pengine が、pacemaker を使用した RHEL 6 または 7 の高可用性クラスターで 15 分ごとにリソースのエラーまたは失敗を報告する
Issue
-
クラスターログに、"Processing failed op monitor for my_script_res on node1.example.com: not running (7)" が繰り返し表示されます。これは、アプリケーションプロセスを手動で停止するか、開始/停止スクリプトを使用して "pcs resource disable" コマンドを実行した後に発生します。
-
クラスターのログによると、15 分ごとにリソースがノードから強制的に切り離されています。
Jul 28 16:00:59 node1 pengine[5878]: warning: common_apply_stickiness: Forcing myResource-custom-start away from node2-priv after 1000000 failures (max=1000000)
-
pengineが、同じリソースについて 15 分ごとに "failed op monitor" という警告を報告します。これによりアラートが発生するため、モニタリングソフトウェアに問題が発生します。 -
pcsでリソースを無効にした後、リソースが実行されていないというエラーがpengineによって繰り返し報告されるのは正常ですか? -
グループに含まれる他のリソースのステータスに影響を与えずに、リソースの失敗回数をリセットするにはどうすればよいですか?
Environment
- Red Hat Enterprise Linux (RHEL) 6 または 7 (High Availability Add-On 使用)
pacemaker
Subscriber exclusive content
A Red Hat subscription provides unlimited access to our knowledgebase, tools, and much more.