1.3.14. 모니터링

1.3.14.1. 경고 규칙 변경

OpenShift Container Platform 4.7에는 다음 경고 규칙 변경 사항이 포함됩니다.

예 1.1. 경고 규칙 변경

  • AlertmanagerClusterCrashlooping 경고가 추가되었습니다. 클러스터의 Alertmanager 인스턴스 중 절반 이상이 크래시 루프 상태에 있는 경우 위험 경보 알림이 발행됩니다.
  • AlertmanagerClusterDown 경고가 추가되었습니다. 클러스터의 Alertmanager 인스턴스 중 절반 이상이 다운된 경우 위험 경보 알림이 발행됩니다.
  • AlertmanagerClusterFailedToSendAlerts 경고가 추가되었습니다. 클러스터의 모든 Alertmanager 인스턴스가 알림을 보내는 데 실패한 경우 위험 경보 알림이 발행됩니다.
  • AlertmanagerFailedToSendAlerts 경고가 추가되었습니다. Alertmanager 인스턴스에서 알림을 보내는 데 실패한 경우 경고 알림이 발행됩니다.
  • etcdBackendQuotaLowSpace 경고가 추가되었습니다. etcd 클러스터의 데이터베이스 크기가 etcd 인스턴스에 정의된 할당량을 초과하면 위험 경보 알림이 발행됩니다.
  • etcdExcessiveDatabaseGrowth 경고가 추가되었습니다. 4시간 동안 etcd 인스턴스의 데이터베이스 크기가 50% 증가한 etcd 쓰기가 관찰된 경우 경고 알림이 발행됩니다.
  • etcdHighFsyncDurations 경고가 추가되었습니다. etcd 클러스터의 99번째 백분율 fsync 기간이 너무 긴 경우 위험 경보 알림이 발행됩니다.
  • KubeletClientCertificateRenewalErrors 경고가 추가되었습니다. Kubelet이 클라이언트 인증서를 업데이트하지 못하는 경우 경고 알림이 발행됩니다.
  • KubeletServerCertificateRenewalErrors 경고가 추가되었습니다. Kubelet이 서버 인증서를 업데이트하지 못하는 경우 경고 알림이 발행됩니다.
  • NTODegraded 경고가 추가되었습니다. Node Tuning Operator가 성능 저하된 경우 경고 알림이 발행됩니다..
  • NTOPodsNotReady 경고가 추가되었습니다. 노드의 특정 Pod가 준비되지 않은 경우 경고 알림이 발행됩니다.
  • PrometheusOperatorNotReady 경고가 추가되었습니다. Prometheus Operator 인스턴스가 준비되지 않은 경우 경고 알림이 발행됩니다.
  • PrometheusOperatorRejectedResources 경고가 추가되었습니다. Prometheus Operator에서 특정 리소스를 거부하는 경우 경고 알림이 발행됩니다.
  • PrometheusOperatorSyncFailed 경고가 추가되었습니다. Prometheus Operator 컨트롤러의 특정 개체 조정에 실패한 경우 경고 알림이 발행됩니다.
  • PrometheusTargetLimitHit 경고가 추가되었습니다. 일부 스크랩 구성이 대상 제한을 초과했기 때문에 Prometheus가 대상을 삭제한 경우 경고 알림이 발행됩니다.
  • ThanosSidecarPrometheusDown 경고가 추가되었습니다. Thanos 사이드카가 Prometheus에 연결할 수 없는 경우 위험 경보 알림이 발행됩니다.
  • ThanosSidecarUnhealthy 경고가 추가되었습니다. Thanos 사이드카가 지정된 기간 내에 비정상 상태이면 위험 경보 알림이 발행됩니다.
  • NodeClockNotSynchronising 경고가 업데이트되어 chronyd 타임 서비스를 사용하는 환경에서 오탐 (false positive)의 발생을 방지합니다.
  • NodeNetworkReceiveErrs 경고가 업데이트되어 소수의 오류만 보고될 때 경고가 발생하지 않도록 합니다. 이제 규칙이 절대 오류 수 대신 총 패킷 수에 대한 오류 비율을 사용합니다.
  • NodeNetworkTransmitErrs 경고가 업데이트되어 보고되는 경고 수가 적은 경우 경고가 발생하지 않습니다. 이제 규칙이 절대 오류 수 대신 총 패킷 수에 대한 오류 비율을 사용합니다.
  • 심각도가 warningcriticaletcdHighNumberOfFailedHTTPRequests 경고인 경우 삭제됩니다. 이러한 경고는 etcd 인스턴스에서 높은 비율의 HTTP 요청이 실패한 경우 실행됩니다.
참고

Red Hat은 지표, 기록 규칙 또는 경고 규칙에 대한 이전 버전과의 호환성을 보장하지 않습니다.