Red Hat Training
A Red Hat training course is available for OpenShift Container Platform
26.5. Node Problem Detector가 실행 중인지 확인
Node Problem Detector가 활성 상태인지 확인하려면 다음을 수행합니다.
다음 명령을 실행하여 Problem Node Detector Pod의 이름을 가져옵니다.
# oc get pods -n openshift-node-problem-detector NAME READY STATUS RESTARTS AGE node-problem-detector-8z8r8 1/1 Running 0 1h node-problem-detector-nggjv 1/1 Running 0 1h
다음 명령을 실행하여 Problem Node Detector Pod에 대한 로그 정보를 확인합니다.
# oc logs -n openshift-node-problem-detector <pod_name>
출력은 다음과 유사해야 합니다.
# oc logs -n openshift-node-problem-detector node-problem-detector-c6kng I0416 23:22:00.641354 1 log_monitor.go:63] Finish parsing log monitor config file: {WatcherConfig:{Plugin:journald PluginConfig:map[source:kernel] LogPath:/host/log/journal Lookback:5m} BufferSize:10 Source:kernel-monitor DefaultConditions:[{Type:KernelDeadlock Status:false Transition:0001-01-01 00:00:00 +0000 UTC Reason:KernelHasNoDeadlock Message:kernel has no deadlock}]
노드에서 이벤트를 시뮬레이션하여 Node Problem Detector를 테스트합니다.
# echo "kernel: divide error: 0000 [#0] SMP." >> /dev/kmsg
노드에서 조건을 시뮬레이션하여 Node Problem Detector를 테스트합니다.
# echo "kernel: task docker:7 blocked for more than 300 seconds." >> /dev/kmsg