1.3.14. モニターリング

1.3.14.1. アラートルールの変更

OpenShift Container Platform 4.7 には、以下のアラートルールの変更が含まれます。

例1.1 アラートルールの変更

  • AlertmanagerClusterCrashlooping アラートが追加されました。重大なアラートは、クラスター内の Alertmanager インスタンスの半分以上がクラッシュループしている場合に通知を出します。
  • AlertmanagerClusterDown アラートが追加されました。重大なアラートは、クラスター内の Alertmanager インスタンスの半分以上が停止している場合に通知を出します。
  • AlertmanagerClusterFailedToSendAlerts アラートが追加されました。重大なアラートは、クラスター内のすべての Alertmanager インスタンスが通知の送信に失敗した場合に通知を出します。
  • AlertmanagerFailedToSendAlerts アラートが追加されました。警告のアラートは、Alertmanager インスタンスが通知の送信に失敗した場合に通知を出します。
  • etcdBackendQuotaLowSpace アラートが追加されました。重大なアラートは、etcd クラスターのデータベースのサイズが etcd インスタンスで定義されるクォータを超える場合に通知を出します。
  • etcdExcessiveDatabaseGrowth アラートが追加されました。警告アラートは、4 時間の間に etcd インスタンスのデータベースのサイズの 50% の増加を生じさせる etcd 書き込み増加が観察される場合に通知を出します。
  • etcdHighFsyncDurations アラートが追加されました。重大なアラートは、etcd クラスターの 99 番目のパーセンタイルの fsync 期間が高すぎる場合に通知を出します。
  • KubeletClientCertificateRenewalErrors アラートが追加されました。警告アラートは、Kubelet がそのクライアント証明書の更新に失敗した場合に通知を出します。
  • KubeletServerCertificateRenewalErrors アラートが追加されました。警告アラートは、Kubelet がそのサーバー証明書の更新に失敗した場合に通知を出します。
  • NTODegraded アラートが追加されました。警告アラートは、Node Tuning Operator のパフォーマンスが低下する場合に通知を出します。
  • NTOPodsNotReady アラートが追加されました。警告アラートは、ノード上の特定の Pod が準備状態にない場合に通知を出します。
  • PrometheusOperatorNotReady アラートが追加されました。警告アラートは、Prometheus Operator インスタンスが準備状態にない場合に通知を出します。
  • PrometheusOperatorRejectedResources アラートが追加されました。警告アラートは、特定のリソースが Prometheus Operator によって拒否される場合に通知を出します。
  • PrometheusOperatorSyncFailed アラートが追加されました。警告アラートは、Prometheus Operator のコントローラーが特定オブジェクトの調整に失敗した場合に通知を出します。
  • PrometheusTargetLimitHit アラートが追加されました。警告アラートは、一部の収集設定がターゲットの制限を超えるために Prometheus がターゲットをドロップした場合に通知を出します。
  • ThanosSidecarPrometheusDown アラートが追加されました。重大アラートは、Thanos サイドカーが Prometheus に接続できないことを示す通知を出します。
  • ThanosSidecarUnhealthy アラートが追加されました。重大アラートは、Thanos サイドカーが指定された期間に正常ではないことを示す通知を出します。
  • NodeClockNotSynchronising が更新され、chrony タイムサービス chronyd を使用する環境での誤検知 (false positive) の発生を防ぐようになりました。
  • NodeNetworkReceiveErrs アラートが更新され、レポートされるエラーの数が少ない場合にアラートが実行されなくなりました。ルールは、エラーの絶対数ではなく、パケットの合計に対するエラーの割合を使用します。
  • NodeNetworkTransmitErrs アラートが更新され、レポートされるエラー数が少ない場合にアラートが実行されなくなりました。ルールは、エラーの絶対数ではなく、パケットの合計に対するエラーの割合を使用します。
  • 重大度が warning および criticaletcdHighNumberOfFailedHTTPRequests アラートが削除されます。これらのアラートは、etcd インスタンスで高い割合の HTTP 要求が失敗する場合に実行されます。
注記

Red Hat は、メトリクス、記録ルールまたはアラートルールの後方互換性を保証しません。