Red Hat Training

A Red Hat training course is available for OpenShift Container Platform

2.3.11.4. Node Problem Detector (テクノロジープレビュー)

この機能は現在 テクノロジープレビュー として提供されており、実稼働環境のワークロードには適していません。

Node Problem Detector (ノード問題検出機能) は特定の問題を検出し、それらの問題を外部コントローラーがアクションを実行する外部 API サーバーに報告することで、ノードの正常性をモニターします。Node Problem Detector は、各ノードで daemonSet として実行されるデーモンです。このデーモンはクラスターに、ノードをスケジュール対象外とするノードレべルの障害を認識させようとします。Node Problem Detector を起動する際に、これに対して、検出する問題を配信するポートを指定します。Node Problem Detector により、データ収集を行うためにサブデーモンをロードすることができます。現時点は、3 つのサブデーモンを使用できます。問題デーモンによって検出される問題は、 NodeCondition として分類できます。

以下は 3 つの問題デーモンです。

  • カーネルモニター: journald でカーネルログをモニターし、正規表現パターンに基づいて問題を報告します。
  • AbrtAdaptor: ノードでカーネルの問題、および journald でアプリケーションのクラッシュをモニターします。
  • CustomerPluginMonitor: 条件の有無をテストできるようにし、条件が満たされない場合には 0 または 1 で終了します。

詳細は、Node Problem Detector を参照してください。