4장. 버그 수정

이 섹션에서는 Red Hat OpenShift Container Storage 4.7에 도입된 주요 버그 수정 사항에 대해 설명합니다.

MON이 다운된 경우에도 MGR Pod가 재시작됩니다.

이전 버전에서는 노드가 MGR Pod를 재시작하면 Pod 초기 설정 상태가 발생하여 새 PV(영구 볼륨)를 생성할 수 없었습니다. 이번 업데이트를 통해 MON이 다운된 경우에도 MGR 포드가 다시 시작됩니다.

(BZ#2005515)

OpenShift Container Platform에서 hugepages가 활성화된 경우 Multicloud Object Gateway를 사용할 수 있습니다.

이전 버전에서는 hugepages가 활성화된 경우 Postgres가 kubernetes에서 실행되지 않아 MCG(Multicloud Object Gateway) db pod가 충돌했습니다. 현재 업데이트를 통해 MCG Postgres Pod의 hugepages가 비활성화되어 MCG db Pod가 충돌하지 않습니다.

(BZ#1968438)

PodDisruptionBudget 경고가 더 이상 지속적으로 표시되지 않습니다.

이전에는 OpenShift Container Platform 경고인 PodDisruptionBudget 경고가 오브젝트 스토리지 장치(OSD)에 대해 지속적으로 표시되었습니다. 기본 문제가 수정되었으며 더 이상 경고가 표시되지 않습니다.

(BZ#1788126)

must-gather 로그 수집 실패

이전 버전에서는 복사 Pod에서 데이터를 정기적으로 다시 사용하지 않아 기본 10분 후에 must-gather 명령이 실패하게 되었습니다. 이번 업데이트를 통해 copy Pod는 must-gather 명령으로 생성된 정기적으로 데이터를 수집하려고 하며 이제 must-gather 명령이 완료될 때까지 실행됩니다.

(BZ#1884546)

volumesnapshotclass가 없는 경우 볼륨 스냅샷에서 PVC를 생성할 수 없습니다.

volumesnapshotclass 가 없는 경우 볼륨 스냅샷에서 PVC를 생성할 수 없습니다. 이 문제는 볼륨 스냅샷의 상태가 volumesnapshotclass 삭제 시 준비되지 않은 상태로 변경되었기 때문입니다. 이 문제는 OCP 4.7.0 이상에서 해결되었습니다.

(BZ#1902711)

프로세스가 충돌하면 코어 덤프가 전파되지 않음

이전에는 프로세스가 충돌한 경우 코어 덤프가 전파되지 않았습니다. 이번 릴리스에서는 기본 ceph 데몬 옆에 있는 log-collector - 사이드카가 도입되었습니다. 이 경우 shareProcessNamespace 플래그가 활성화되고 이 플래그 신호를 컨테이너 간에 가로채어 coredumps를 생성할 수 있습니다.

(BZ#1904917)

Mulitple OSD 제거 작업이 더 이상 실패하지 않습니다.

이전 버전에서는 여러 OSD 제거를 위해 작업을 트리거할 때 템플릿에 작업 이름의 OSD ID가 쉼표로 포함되어 있었습니다. 이로 인해 작업 템플릿이 실패했습니다. 이번 업데이트를 통해 유효한 형식을 유지하기 위해 OSD ID가 작업 이름에서 제거되었습니다. 작업 이름이 ocs-osd-removal-${FAILED_OSD_IDS} 에서 ocs-osd-removal-job 으로 변경되었습니다.

(BZ#1908678)

mon failover timeout 증가

이번 업데이트에서는 IBM Cloud에서 mon failover timeout이 15분으로 증가했습니다. 이전에는 몬드가 다가오는 동안 장애 조치(failover)가 시작되었습니다.

(BZ#1922421)

이제 rook에서 이전 OpenShift Container Storage 설치에서 불명확 디스크 감지에 대한 메시지와 함께 OSD 배포를 거부합니다.

이전 버전에서는 OpenShift Container Storage의 이전 설치에서 정리되지 않은 디스크를 재사용하면 Rook에서 강제로 작동하지 않았습니다. 이번 업데이트를 통해 Rook에서 디스크가 다른 클러스터에 속하는 것을 감지하고 오류 메시지와 함께 해당 디스크의 OSD 배포를 거부할 수 있습니다(BZ#1922954).

Mon failover로 인해 더 이상 Ceph에 액세스할 수 없습니다.

이전 버전에서는 다른 몬이 넘어진 동안 원이 내려지면 몬이 쿼럼을 잃을 수 있었습니다. mons가 쿼럼이 손실되면 Ceph에 액세스할 수 없습니다. 이번 업데이트에서는 mon이 장애 조치되어 Ceph에 액세스할 수 없게 되는 동안 자발적으로 mon drains를 방지할 수 있습니다.

(BZ#1935065)

GRPC 메트릭에 대해 cpehcsi 노드 플러그인 Pod 사전 배치 포트

이전 버전에서는 cephcsi Pod에서 디버깅 목적으로 GRPC 메트릭을 표시했기 때문에 cephcsi 노드 플러그인 Pod에서 CephFS의 경우 RBD 및 9091의 포트 9090을 사용했습니다. 결과적으로 포트를 사용할 수 없어 cephsi Pod가 시작되지 않았습니다. 이번 릴리스에서는 디버깅에만 필요한 경우에만 GRPC 메트릭이 비활성화되어 있으며 이제 cephcsi 는 노드 플러그인 Pod가 실행 중인 노드에서 포트 9091 및 9090을 사용하지 않습니다.

(BZ#1937245)

rook-ceph-mds 는 모니터 서버에 Pod IP를 등록하지 않았습니다.

이전 버전에서는 rook-ceph-mds 가 모니터 서버에 Pod IP를 등록하지 않았기 때문에 시간 초과된 파일 시스템에 있는 모든 마운트를 프로비저닝할 수 없었습니다. 따라서 CephFS 볼륨 프로비저닝에 오류가 발생할 수 없었습니다. 이번 릴리스에서는 호스트 네트워크가 활성화되지 않은 경우 MDS Pod에 --public-addr=podIP 인수를 추가합니다. 따라서 이제 CephFS 볼륨 프로비저닝이 실패하지 않습니다.

(BZ#1939272)

의 오류는 규칙 평가 실패로 인해 수집되어야 합니다.

이전 버전에서는 기록 규칙 레코드: cluster:ceph_disk_latency:join_ceph_node_disk_irate1m 은 Prometheus에서 다대다 일치가 허용되지 않기 때문에 평가되지 않았습니다. 그 결과 이 실패한 규칙 평가로 인해 를 수집하고 배포에 오류가 발생했습니다. 이번 릴리스에서는 다대다 일치 시나리오를 제거하도록 레코딩 규칙 쿼리가 업데이트되어 이제 Prometheus 규칙 평가가 실패하지 않아야 하며 배포에 표시되는 오류가 없어야 합니다.

(BZ#1904302)