OpenShift Data Foundation 문제 해결

이름:nooBaaNamespaceResourceErrorState

Message:NooBaa 네임스페이스 리소스가 오류 상태에있습니다.

설명:NooBaa 네임스페이스 리소스 {{ $labels.namespace_resource_name }}는 5m 이상 오류 상태입니다.

심각도: 경고

해결 방법: 수정

이름:nooBaaNamespaceBucketErrorState

Message:NooBaa 네임스페이스 버킷이 오류 상태에있습니다.

설명:NooBaa 네임스페이스 버킷 {{ $labels.bucket_name }}는 5m 이상 오류 상태입니다.

심각도: 경고

해결 방법: 수정

절차: NooBaa Bucket Exceeding Quota State

이름:NooBaaBucketExceedingQuotaState

메시지:NooBaa 버킷이 할당량 상태임

설명:NooBaa 버킷 {{ $labels.bucket_name }}가 할당량을 초과하고 있습니다. {{ printf "%0.0f" $value }}% 사용 메시지: A NooBaa Bucket Is In Exceeding Quota State

심각도: 경고

해결 방법: 수정

이름:NooBaaBucketLowCapacityState

메시지:NooBaa Bucket이 낮은 용량 상태에있습니다.

설명:NooBaa 버킷 {{ $labels.bucket_name }}는 용량의 {{ printf "%0.0f" $value }}%를 사용합니다.

심각도: 경고

해결 방법: 수정

이름:NooBaaBucketNoCapacityState

메시지:NooBaa Bucket Is In No Capacity State

설명:NooBaa 버킷 {{ $labels.bucket_name }}는 모든 용량을 사용하고있습니다.

심각도: 경고

해결 방법: 수정

이름:NooBaaBucketReachingQuotaState

Message:NooBaa Bucket is in Reaching Quota State

설명:NooBaa 버킷 {{ $labels.bucket_name }}는 할당량의 {{ printf "%0.0f" $value }}%를 사용합니다.

심각도: 경고

해결 방법: 수정

이름:nooBaaResourceErrorState

메시지:NooBaa 리소스가 오류 상태에있습니다.

설명:NooBaa 리소스 {{ $labels.resource_name }}는 6m 이상 오류 상태입니다.

심각도: 경고

해결 방법: 해결 방법

이름:NooBaaSystemCapacityWarning100

메시지:NooBaa 시스템이 용량에 접근

설명:NooBa 시스템이 용량에 접근하여 사용량이 100 %입니다.

심각도: 경고

해결 방법: 수정

이름:nooBaaSystemCapacityWarning85

메시지:NooBaa 시스템이 용량에 접근하고 있습니다.

설명:NooBa 시스템이 용량에 접근하고 있으며 사용량은 85%를 초과합니다.

심각도: 경고

해결 방법: 수정

이름:NooBaaSystemCapacityWarning95

메시지:NooBaa 시스템이 용량에 접근하고 있습니다.

설명:NooBaa 시스템이 용량에 접근하고 있으며 사용량은 95%를 초과합니다.

심각도: 경고

해결 방법: 수정

이름:CephMdsMissingReplicas

Message:Insufficient replicas for storage metadata service.

설명: '스토리지 메타데이터 서비스에 필요한 최소 복제본은 사용할 수 없습니다.

스토리지 클러스터의 작동에 영향을 미칠 수 있습니다.

심각도: 경고

절차:

경고 및 Operator 상태를 확인합니다.
문제를 확인할 수 없는 경우 Red Hat 지원팀에 문의하십시오.

name:CephMgrIsAbsent

Message:스토리지 메트릭 수집기 서비스를 더 이상 사용할 수 없습니다.

설명:Ceph Manager가 Prometheus 대상 검색에서 사라졌습니다.

심각도: 심각

절차:

사용자 인터페이스 및 로그를 검사하고 업데이트가 진행 중인지 확인합니다.
- 진행 중인 업데이트가 있는 경우 이 경고는 일시적입니다.
- 업데이트가 진행되지 않은 경우 업그레이드 프로세스를 다시 시작합니다.
업그레이드가 완료되면 경고 및 Operator 상태를 확인합니다.
문제가 지속되거나 확인되지 않은 경우 Red Hat 지원팀에 문의하십시오.

이름:CephNodeDown

메시지:저장 노드 {{ $labels.node }}가 중단되었습니다.

설명:Storage node {{ $labels.node }}가 중단되었습니다. 노드를 즉시 확인하십시오.

심각도: 심각

절차:

어떤 노드가 작동을 중단했는지 확인하고 원인을 확인합니다.
노드를 복구하려면 적절한 작업을 수행합니다. 노드를 복구할 수 없는 경우:
- Red Hat OpenShift Data Foundation의 스토리지 노드 교체를 참조하십시오.
- Red Hat 지원에 문의하십시오.

name:CephClusterErrorState

Message:Storage 클러스터가 오류 상태

스토리지 클러스터는 10m 이상 오류 상태에 있습니다.

심각도: 심각

절차:

경고 및 Operator 상태를 확인합니다.
문제를 확인할 수 없는 경우 must-gather를 사용하여 로그 파일 및 진단 정보를 다운로드 합니다.
must-gather의 출력 첨부 파일로 Red Hat 지원을 통해 지원 티켓을 엽니다.

name:CephClusterWarningState

Message:스토리지 클러스터가 성능이 저하된 상태

설명 : 스토리지 클러스터는 10m 이상 경고 상태에 있습니다.

심각도: 경고

절차:

경고 및 Operator 상태를 확인합니다.
문제를 확인할 수 없는 경우 must-gather를 사용하여 로그 파일 및 진단 정보를 다운로드 합니다.
must-gather의 출력 첨부 파일로 Red Hat 지원을 통해 지원 티켓을 엽니다.

name:CephDataRecoveryTakingTooLong

메시지:데이터 복구 속도가 느려집니다.

설명:데이터 복구가 너무 오래 활성 상태였습니다.

심각도: 경고

이름:CephOSDDiskNotResponding

Message:디스크가 응답하지 않음

설명: 호스트{{ $labels.host }}의 디스크 장치 {{ $labels.device }}가 응답하지 않습니다.

심각도: 심각

Name:CephOSDDiskUnavailable

Message: 디스크에액세스할 수 없음

설명: 호스트{{ $labels.host }}에서 디스크 장치 {{ $labels.device }}에 액세스할 수 없습니다.

심각도: 심각

이름:CephPGRepairTakingTooLong

message:감지된 자체 복구 문제

설명:자체 복구 작업은 너무 오래 걸립니다.

심각도: 경고

name:CephMonHighNumberOfLeaderChanges

Message:Storage Cluster는 최근 많은 리더의 변경 사항을 확인했습니다.

설명:'{{ $labels.job }}": instance {{ $labels.instance }} has seen {{ $value printf "%.2f" }} leader changes per minute per minute.'

심각도: 경고

name:CephMonQuorumAtRisk

Message:위험에 대한 스토리지 쿼럼

설명:스토리지 클러스터 쿼럼이 낮습니다.

심각도: 심각

이름:ClusterObjectStoreState

Message:Cluster 오브젝트 저장소가 비정상 상태에 있습니다. Ceph 클러스터 상태 를 확인하십시오.

설명:Cluster 오브젝트 저장소는 15s 이상 비정상 상태가 됩니다. Ceph 클러스터 상태 를 확인하십시오.

심각도: 심각

절차:

CephObjectStore CR 인스턴스를 확인합니다.
Red Hat 지원에 문의하십시오.

이름:CephOSDFla*

메시지:Storage 데몬 osd.x가 지난 5 분 동안 5 번 다시 시작되었습니다. Pod 이벤트 또는 Ceph 상태를 확인하여 원인을 확인하십시오.

설명:스토리지 OSD는 5분 동안 5회 이상 다시 시작됩니다.

심각도: 심각

Name:OdfPoolMirroringImageHealth

Message:pool-name> 풀의 이미지 PV(PV)는 1m 이상에 대한 Warning 상태에 있습니다. 미러링이 예상대로 작동하지 않을 수 있습니다.

설명: 하나 또는 몇 가지 애플리케이션에 대해 재해 복구가 실패합니다.

심각도: 경고

Name:OdfMirrorDaemonStatus

Message:Mirror daemon은 비정상입니다.

설명: 전체 클러스터에 대해 재해 복구가 실패합니다. 미러 데몬은 1m 이상 비정상 상태에 있습니다. 이 클러스터의 미러링이 예상대로 작동하지 않습니다.

심각도: 심각