高負荷平均、時間が経過するにつれ crmd が "High CPU load" を報告する頻度が増え、ログ内の XFS 呼び出しでハングしたタスクのバックトレースがスタックし、lvm コマンドがブロックされるか、RHEL 7 High Availability クラスターで corosync が CPU を 100% 使用する、またはその両方が発生する
Issue
- サーバーで数百もしくは数千もの
netstatコマンドとnetstatコマンドがスタックしており、負荷平均は数千であるのに CPU の使用量はごくわずかであることが判明しました。 - プロセスが XFS スラブシュリンカーで待機状態になります。
- クラスターノードで高負荷が検出され、システムにログインできませんでした。 引き続きメンバーではありますが、コンソールまたは SSH 経由では応答しませんでした。
corosyncは、1 つのノードだけで CPU を 100% 使用しており、負荷平均は非常に高く、psやnetstatなどの多くのプロセスがスタックしているようです。corosyncが CPU 全体を占有しているように見えますが、/var/log/messagesには、XFS 関数で待機しているプロセスを示す hung-task 警告があります。corosyncが 1 つのノードで大量の CPU を使用しているのはなぜですか?- プロセスが何かを待機してハングし、vmcore がキャプチャーされた後、アプリケーションがスタックしました。 いくつかのプロセスが
xfs_fs_free_cached_objectsにおいて待機状態でスタックしています。 - 頻繁に
lvmコマンドがブロックされ、LVMリソース操作がタイムアウトになります。 corosyncとclvmdは、クラスター内の 1 つのノードで CPU を 100% 使用してスピンします。
Environment
- Red Hat Enterprise Linux (RHEL) 7 (High Availability アドオン使用)
Subscriber exclusive content
A Red Hat subscription provides unlimited access to our knowledgebase, tools, and much more.