Menu Close

5.10. 머신 구성 데몬 메트릭

머신 구성 데몬은 Machine Config Operator의 일부입니다. 클러스터의 모든 노드에서 실행됩니다. 머신 구성 데몬은 각 노드의 구성 변경 및 업데이트를 관리합니다.

5.10.1. 머신 구성 데몬 메트릭

OpenShift Container Platform 4.3부터는 머신 구성 데몬에서 일련의 메트릭을 제공합니다. 이러한 메트릭은 Prometheus 클러스터 모니터링 스택을 사용하여 액세스할 수 있습니다.

다음 테이블에 이러한 메트릭 집합이 설명되어 있습니다.

참고

* Name* 및 Description 열에서 *로 표시된 지표는 성능 문제를 일으킬 수 있는 심각한 오류를 나타냅니다. 이러한 문제가 발생하면 업데이트 및 업그레이드가 진행되지 않을 수 있습니다.

참고

일부 항목에는 특정 로그를 가져오는 명령이 포함되지만 oc adm must-gather 명령을 사용하여 가장 포괄적인 로그 집합을 사용할 수 있습니다.

표 5.4. MCO 메트릭

이름형식설명참고

mcd_host_os_and_version

[]string{"os", "version"}

MCD가 실행 중인 OS(예: RHCOS 또는 RHEL)를 표시합니다. RHCOS의 경우 버전이 제공됩니다.

 

ssh_accessed

카운터

노드에 대한 SSH 인증 수를 표시합니다.

0이 아닌 값은 노드에 수동 변경이 있을 수 있음을 보여줍니다. 이러한 변경으로 인해 디스크의 상태와 머신 구성에 정의된 상태가 달라 불일치 오류가 발생할 수 있습니다.

mcd_drain*

{"drain_time", "err"}

드레이닝 실패 중 수신한 오류를 기록합니다. *

드레이닝에 성공하려면 여러 번 시도해야 할 수 있지만 터미널에서 드레이닝이 실패하면 업데이트가 진행되지 않습니다. drain_time 메트릭은 드레이닝에 걸린 시간을 표시하며 문제 해결에 도움이 될 수 있습니다.

추가 조사가 필요한 경우 다음을 실행하여 로그를 참조하십시오.

$ oc logs -f -n openshift-machine-config-operator machine-config-daemon-<hash> -c machine-config-daemon

mcd_pivot_err*

[]string{"pivot_target", "err"}

피벗 중 로그 오류가 발생했습니다. *

피벗 오류로 인해 OS 업그레이드가 진행되지 않을 수 있습니다.

추가 조사를 수행하려면 다음 명령을 실행하여 노드에 액세스한 후 해당 로그를 모두 확인합니다.

$ oc debug node/<node> — chroot /host journalctl -u pivot.service

또는 다음 명령을 실행하여 machine-config-daemon 컨테이너의 로그만 볼 수도 있습니다.

$ oc logs -f -n openshift-machine-config-operator machine-config-daemon-<hash> -c machine-config-daemon

mcd_state

[]string{"state", "reason"}

표시된 노드의 머신 구성 데몬 상태입니다. 가능한 상태는 "완료", "작업 중", "저하됨"입니다. "저하됨"의 경우 이유가 포함됩니다.

추가 조사가 필요한 경우 다음을 실행하여 로그를 참조하십시오.

$ oc logs -f -n openshift-machine-config-operator machine-config-daemon-<hash> -c machine-config-daemon

mcd_kubelet_state*

[]string{"err"}

kubelet 상태 장애를 기록합니다. *

이 값은 비어 있고 실패 횟수가 0이어야 합니다. 실패 횟수가 2를 초과하면 임계값이 초과되었음을 나타내는 오류입니다. 이는 kubelet 상태에 문제가 있을 수 있음을 나타냅니다.

추가 조사를 수행하려면 다음 명령을 실행하여 노드에 액세스한 후 해당 로그를 모두 확인합니다.

$ oc debug node/<node> — chroot /host journalctl -u kubelet

mcd_reboot_err*

[]string{"message", "err"}

실패한 재부팅 및 해당 오류를 기록합니다. *

이 값은 비어 있을 것으로 예상되며, 재부팅에 성공했음을 나타냅니다.

추가 조사가 필요한 경우 다음을 실행하여 로그를 참조하십시오.

$ oc logs -f -n openshift-machine-config-operator machine-config-daemon-<hash> -c machine-config-daemon

mcd_update_state

[]string{"config", "err"}

구성 업데이트의 성공 또는 실패와 해당 오류를 기록합니다.

예상 값은 rendered-master/rendered-worker-XXXX입니다. 업데이트에 실패하면 오류가 발생합니다.

추가 조사가 필요한 경우 다음을 실행하여 로그를 참조하십시오.

$ oc logs -f -n openshift-machine-config-operator machine-config-daemon-<hash> -c machine-config-daemon

추가 리소스