7장. 확인된 문제

이 섹션에서는 Red Hat OpenShift Container Storage 4.7에서 알려진 문제에 대해 설명합니다.

RHCS 클러스터에서 활성 mgr 변경 사항이 있으면 RGW 메트릭을 더 이상 사용할 수 없습니다.

활성 MGR이 외부 클러스터 모드로 전환되면 OpenShift Container Platform(OCP)은 MGR이 다시 실행된 경우에도 RHCS(Red Hat Ceph Storage) 클러스터에서 추가 지표 수집을 중지합니다. 즉, 현재 활성 MGR에 대한 연결이 손실되면 RADOS Object Gateway(RGW) 지표가 더 이상 수집되지 않습니다.

Red Hat OpenShift Container Storage 4.7의 경우 해결방법은 다음과 같습니다.

외부 RHCS가 활성 MGR을 복구하면 python 스크립트 ceph-external-cluster-details-exporter.py 를 다시 실행한 후 JSON 출력 파일을 수집합니다. OCP 측에서 이전에 수집된 JSON 파일의 출력과 함께 이름이 rook-ceph-external-cluster-details 인 외부 시크릿을 업데이트합니다. 이렇게 하면 조정이 트리거되고 OCP에서 메트릭을 다시 선택하기 시작합니다.

(BZ#1908238)

OpenShift Container Storage 클러스터 설치 중 Vault의 OSD 키는 삭제되지 않습니다.

현재 OSD의 키 암호화 키는 Vault Key/V(Key/V) Secret 엔진 API를 삭제할 때 Vault에서 소프트 삭제되며 KMS와 클러스터 전체 암호화에 버전 2가 사용됩니다. 즉, 키 메타데이터가 계속 표시되고 키의 모든 버전을 검색할 수 있습니다.

해결방법: vault kv metadata delete 명령을 사용하여 키의 메타데이터를 수동으로 삭제합니다.

(BZ#1975323)

MDS 보고서 초과 캐시

업그레이드 시 rook이 이전에 mds_cache_memory_limit 를 적용하지 않았습니다. 즉, 해당 옵션이 적용되지 않은 OpenShift Container Storage 4.2 클러스터는 올바른 값으로 업데이트되지 않았습니다. 이는 일반적으로 Pod 메모리 제한 크기의 절반입니다. 따라서 standby-replay의 MDSs는 초과화된 캐시를 보고할 수 있습니다.

(BZ#1944148)

flexibleScaling 및 arbiter가 모두 활성화되면 스토리지 클러스터 단계가 준비

중재자 및 유연한 스케일링이 활성화되면 스토리지 클러스터 CR에 대한 잘못된 사양이 있습니다. 즉, 오류 arbiter 및 flexibleScaling이 둘 다 활성화된 상태로 로그 또는 메시지가 있는 경우에도 사용자가 스토리지 클러스터를 READY 상태로 볼 수 없습니다. 이는 기능에 영향을 미치지 않습니다.

(BZ#1946595)

중재자 노드는 OpenShift Container Storage 노드 레이블로 라벨을 지정할 수 없습니다.

arbiter 노드는 OpenShift Container Storage 노드 레이블, cluster.ocs.openshift.io/openshift-storage 로 레이블이 지정된 경우 유효한 비호환 노드로 간주됩니다. 즉, 비arbiter 리소스에 대한 배치가 결정되지 않습니다. 이 문제를 해결하려면 중재자 리소스만 중재자 노드에 배치되도록 OpenShift Container Storage 노드 레이블로 중재자 노드에 라벨을 지정하지 마십시오.

(BZ#1947110)

noobaa-db-pg-0문제

NooBaa-db-pg-0 포드는 호스팅 노드가 중단된 경우 다른 노드로 마이그레이션되지 않습니다. noobaa-db-pg-0 Pod의 마이그레이션으로 노드가 차단되면 NooBaa가 작동하지 않습니다.

(BZ#1783961)

상위 PVC보다 큰 크기의 스냅샷/복제 작업을 복원하면 무한한 루프가 발생합니다.

Ceph CSI는 상위 PVC보다 큰 스냅샷 복원 또는 복제본 생성을 지원하지 않습니다. 따라서 더 큰 크기를 가진 스냅샷/복제 작업을 복원하면 무한한 루프가 발생합니다. 이 문제를 해결하려면 보류 중인 PVC를 삭제합니다. 더 큰 PVC를 얻으려면 사용 중인 작업에 따라 다음 중 하나를 완료합니다.

  • Snapshots를 사용하는 경우 기존 스냅샷을 저장하여 상위 PVC와 동일한 크기의 볼륨을 생성한 다음 Pod에 연결하고 PVC를 필요한 크기로 확장합니다. 자세한 내용은 볼륨 스냅샷을 참조하십시오.
  • Clone을 사용하는 경우 상위 PVC를 복제하여 상위 PVC와 동일한 크기의 볼륨을 생성한 다음 Pod에 연결하고 PVC를 필요한 크기로 확장합니다. 자세한 내용은 볼륨 복제 를 참조하십시오.

(BZ#1870334)

디스크 교체 후 Ceph 상태는 HEALTH_WARN 입니다.

디스크 교체 후 모든 OSD Pod가 가동되고 실행 중인 경우에도 경고 1 데몬이 최근에 충돌 한 것으로 표시됩니다. 이 경고는 Ceph 상태가 변경됩니다. Ceph 상태는 HEALTH_WARN 대신 HEALTH_OK 여야 합니다. 이 문제를 해결하기 위해 ceph-tools 포드에 대한 rsh 를 확인하고 경고를 음소거하면 Ceph 상태가 HEALTH_OK 로 돌아갑니다.

(BZ#1896810)

암호화된 OpenShift Container Storage 클러스터의 사용자 인터페이스를 통해 장치 교체 작업을 수행할 수 없습니다.

암호화된 OpenShift Container Storage 클러스터에서 검색 결과 CR은 Ceph OSD(Object Storage Daemon)에서 Ceph 경고에 보고된 장치와 다르게 검색합니다. 경고를 클릭하면 사용자에게 Disk not found 메시지가 표시됩니다. 불일치로 인해 콘솔 UI에서 OpenShift Container Storage 사용자에 대한 디스크 교체 옵션을 활성화할 수 없습니다. 이 문제를 해결하려면 장치 교체 가이드의 실패한 장치 교체 에 대한 CLI 절차를 사용하십시오.

(BZ#1906002)

새로 복원된 PVC를 마운트할 수 없음

일부 OCP 노드가 8.2 미만의 Red Hat Enterprise Linux 버전에서 실행되고 있고 복원된 스냅샷이 삭제된 경우 새로 복원된 PVC를 마운트할 수 없습니다. 이 문제를 방지하려면 복원된 PVC가 삭제될 때까지 PVC가 복원되는 스냅샷을 삭제하지 마십시오.

(BZ#1956232)

교체를 시작하기 전에 디스크의 상태가 교체 준비

두 디스크의 이름이 모두 동일한 경우 사용자 인터페이스에서 다른 또는 동일한 노드의 새 디스크 오류와 이전에 실패한 디스크를 구별할 수 없습니다. 동일한 이름 문제로 인해 사용자 인터페이스에서 새로 실패한 디스크가 이미 교체되었다고 간주하면 디스크 교체가 허용되지 않습니다. 이 문제를 해결하려면 다음 단계를 따르십시오.

  1. OpenShift Container Platform 웹 콘솔 → 관리자를 클릭합니다.
  2. 검색을 클릭합니다.
  3. 리소스 드롭다운 에서 → TemplateInstance 를 검색합니다.
  4. TemplateInstance 를 선택하고 openshift-storage 네임스페이스 를 선택합니다.
  5. 모든 템플릿 인스턴스를 삭제합니다.

(BZ#1958875)