Red Hat Training

A Red Hat training course is available for OpenShift Container Platform

26.2. Node Problem Detector 출력 예

다음 예제에서는 특정 노드에서 커널 교착 상태의 Node Problem Detector 감시의 출력을 보여줍니다. 명령은 oc get node 를 사용하여 로그에서 KernelDeadlock 항목에 대한 특정 노드 필터링을 확인합니다.

# oc get node <node> -o yaml | grep -B5 KernelDeadlock

문제 없는 샘플 Node Problem Detector 출력

message: kernel has no deadlock
reason: KernelHasNoDeadlock
status: false
type: KernelDeadLock

KernelDeadLock 상태의 출력 예

message: task docker:1234 blocked for more than 120 seconds
reason: DockerHung
status: true
type: KernelDeadLock

이 예에서는 노드의 이벤트를 위한 Node Problem Detector 감시의 출력을 보여줍니다. 다음 명령은 Node Problem Detector 구성 맵 kernel-monitor.json 섹션에 나열된 이벤트를 기본 프로젝트 감시에 대해 oc get 이벤트를 사용합니다.

# oc get event -n default --field-selector=source=kernel-monitor --watch

노드에서 이벤트를 표시하는 샘플 출력

LAST SEEN                       FIRST SEEN                    COUNT NAME     KIND  SUBOBJECT TYPE    REASON      SOURCE                   MESSAGE
2018-06-27 09:08:27 -0400 EDT   2018-06-27 09:08:27 -0400 EDT 1     my-node1 node            Warning TaskHunk    kernel-monitor.my-node1  docker:1234 blocked for more than 300 seconds
2018-06-27 09:08:27 -0400 EDT   2018-06-27 09:08:27 -0400 EDT 3     my-node2 node            Warning KernelOops  kernel-monitor.my-node2  BUG: unable to handle kernel NULL pointer deference at nowhere
2018-06-27 09:08:27 -0400 EDT   2018-06-27 09:08:27 -0400 EDT 1     my-node1 node            Warning KernelOops  kernel-monitor.my-node2  divide error 0000 [#0] SMP

참고

Node Problem Detector는 리소스를 사용합니다. Node Problem Detector를 사용하는 경우 클러스터 성능의 균형을 조정할 수 있는 충분한 노드가 있는지 확인합니다.