1.4. 문제 해결

클러스터 관리자는 다음 OpenShift Container Platform 구성 요소 문제를 모니터링하고 해결할 수 있습니다.

  • 설치 문제: OpenShift Container Platform 설치는 다양한 단계를 거칩니다. 다음을 수행할 수 있습니다.

    • 설치 단계를 모니터링합니다.
    • 설치 문제가 발생하는 단계를 확인합니다.
    • 여러 설치 문제를 조사합니다.
    • 실패한 설치에서 로그를 수집합니다.
  • 노드 문제: 클러스터 관리자는 노드의 상태, 리소스 사용량 및 구성을 검토하여 노드 관련 문제를 확인하고 문제를 해결할 수 있습니다. 다음을 쿼리할 수 있습니다.

    • 노드의 kubelet의 상태입니다.
    • 클러스터 노드 저널 로그입니다.
  • crio 문제: 클러스터 관리자는 각 클러스터 노드에서 CRI-O 컨테이너 런타임 엔진 상태를 확인할 수 있습니다. 컨테이너 런타임 문제가 발생하는 경우 다음을 수행합니다.

    • CRI-O journald 장치 로그를 수집합니다.
    • CRI-O 스토리지 정리.
  • 운영 체제 문제: OpenShift Container Platform은 Red Hat Enterprise Linux CoreOS에서 실행됩니다. 운영 체제 문제가 발생하면 커널 충돌 절차를 조사할 수 있습니다. 다음을 확인합니다.

    • kdump를 활성화합니다.
    • kdump 설정을 테스트합니다.
    • 코어 덤프 분석.
  • 네트워크 문제: Open vSwitch 문제를 해결하려면 클러스터 관리자가 다음을 수행할 수 있습니다.

    • Open vSwitch 로그 수준을 일시적으로 구성합니다.
    • Open vSwitch 로그 수준을 영구적으로 구성합니다.
    • Open vSwitch 로그를 표시합니다.
  • Operator 문제: 클러스터 관리자는 Operator 문제를 해결하기 위해 다음을 수행할 수 있습니다.

    • Operator 서브스크립션 상태를 확인합니다.
    • Operator Pod 상태를 확인합니다.
    • Operator 로그를 수집합니다.
  • Pod 문제: 클러스터 관리자는 Pod의 상태를 검토하고 다음을 완료하여 Pod 관련 문제를 해결할 수 있습니다.

    • Pod 및 컨테이너 로그를 검토합니다.
    • 루트 액세스 권한으로 디버그 Pod를 시작합니다.
  • S2I (Source-to-Image) 문제: 클러스터 관리자는 S2I 단계를 관찰하여 S2I 프로세스에서 오류가 발생한 위치를 확인할 수 있습니다. S2I(Source-to-Image) 문제를 해결하려면 다음을 수집합니다.

    • S2I(Source-to-Image) 진단 데이터.
    • 애플리케이션 오류를 조사하기 위한 애플리케이션 진단 데이터입니다.
  • 스토리지 문제: 오류가 발생한 노드가 연결된 볼륨을 마운트 해제할 수 없기 때문에 새 노드의 마운트 볼륨이 불가능한 경우 다중 연결 스토리지 오류가 발생합니다. 클러스터 관리자는 다음을 수행하여 다중 연결 스토리지 문제를 해결할 수 있습니다.

    • RWX 볼륨을 사용하여 여러 연결을 활성화합니다.
    • RWO 볼륨을 사용할 때 오류가 발생한 노드를 복구하거나 삭제합니다.
  • 모니터링 문제: 클러스터 관리자는 모니터링을 위한 문제 해결 페이지의 절차를 따를 수 있습니다. 사용자 정의 프로젝트에 대한 메트릭을 사용할 수 없거나 Prometheus가 많은 디스크 공간을 사용하는 경우 다음을 확인합니다.

    • 사용자 정의 메트릭을 사용할 수 없는 이유를 조사합니다.
    • Prometheus가 많은 디스크 공간을 소비하는 이유를 확인합니다.
  • 로깅 문제: 클러스터 관리자는 OpenShift Logging 문제의 문제 해결 페이지에서 절차를 따를 수 있습니다. 로깅 문제를 해결하려면 다음을 확인합니다.

  • OpenShift CLI(oc) 문제: 로그 수준을 늘려 OpenShift CLI(oc) 문제를 해결합니다.