Red Hat Training

A Red Hat training course is available for OpenShift Container Platform

26.5. Node Problem Detector가 실행 중인지 확인

Node Problem Detector가 활성 상태인지 확인하려면 다음을 수행합니다.

  • 다음 명령을 실행하여 Problem Node Detector Pod의 이름을 가져옵니다.

    # oc get pods -n openshift-node-problem-detector
    
    NAME                          READY     STATUS    RESTARTS   AGE
    node-problem-detector-8z8r8   1/1       Running   0          1h
    node-problem-detector-nggjv   1/1       Running   0          1h
  • 다음 명령을 실행하여 Problem Node Detector Pod에 대한 로그 정보를 확인합니다.

    # oc logs -n openshift-node-problem-detector <pod_name>

    출력은 다음과 유사해야 합니다.

    # oc logs -n openshift-node-problem-detector node-problem-detector-c6kng
    I0416 23:22:00.641354       1 log_monitor.go:63] Finish parsing log monitor config file: {WatcherConfig:{Plugin:journald PluginConfig:map[source:kernel] LogPath:/host/log/journal Lookback:5m} BufferSize:10 Source:kernel-monitor DefaultConditions:[{Type:KernelDeadlock Status:false Transition:0001-01-01 00:00:00 +0000 UTC Reason:KernelHasNoDeadlock Message:kernel has no deadlock}]
  • 노드에서 이벤트를 시뮬레이션하여 Node Problem Detector를 테스트합니다.

    # echo "kernel: divide error: 0000 [#0] SMP." >> /dev/kmsg
  • 노드에서 조건을 시뮬레이션하여 Node Problem Detector를 테스트합니다.

    # echo "kernel: task docker:7 blocked for more than 300 seconds." >> /dev/kmsg