부록 A. 자체 호스팅 엔진 배포 문제 해결

셀프 호스트 엔진이 이미 배포되었는지 확인하려면 hosted-engine --check-deployed 을 실행합니다. 셀프 호스트 엔진을 배포하지 않은 경우에만 오류가 표시됩니다.

A.1. Manager 가상 머신 문제 해결

hosted-engine --vm-status 를 실행하여 Manager 가상 시스템의 상태를 확인합니다.

참고

Manager 가상 머신의 변경 사항은 상태 명령 출력에 반영되기까지 약 20초가 걸립니다.

출력의 엔진 상태에 따라 다음 제안 사항을 참조하십시오. 문제를 발견하거나 수정합니다.

엔진 상태: "health": "good", "vm": "up" "detail": "up"

  1. Manager 가상 머신이 정상적으로 실행되고 있는 경우 다음 출력이 표시됩니다.

    --== Host 1 status ==--
    
    Status up-to-date              : True
    Hostname                       : hypervisor.example.com
    Host ID                        : 1
    Engine status                  : {"health": "good", "vm": "up", "detail": "up"}
    Score                          : 3400
    stopped                        : False
    Local maintenance              : False
    crc32                          : 99e57eba
    Host timestamp                 : 248542
  2. 출력이 정상이지만 Manager에 연결할 수 없는 경우 네트워크 연결을 확인합니다.

엔진 상태: "reason": "failed livelines check", "health": "bad", "vm": "up", "detail": "up"

  1. 상태가 좋지 않고 vm가동 되는 경우 HA 서비스에서 Manager 가상 머신을 다시 시작하여 Manager를 다시 시작합니다. 몇 분 내에 성공하지 못하면 명령줄에서 글로벌 유지 관리 모드를 활성화하여 호스트를 더 이상 HA 서비스에서 관리하지 않도록 합니다.

    # hosted-engine --set-maintenance --mode=global
  2. 콘솔에 연결합니다. 메시지가 표시되면 운영 체제의 루트 암호를 입력합니다. 자세한 콘솔 옵션은 https://access.redhat.com/solutions/2221461 을 참조하십시오.

    # hosted-engine --console
  3. 로그인하여 Manager 가상 시스템의 운영 체제가 실행 중인지 확인합니다.
  4. ovirt-engine 서비스의 상태를 확인합니다.

    # systemctl status -l ovirt-engine
    # journalctl -u ovirt-engine
  5. /var/log/messages,/var/log/ovirt-engine/engine.log, /var/log/ovirt-engine/server.log 을 확인합니다.
  6. 문제를 해결한 후 자체 호스팅 엔진 노드 중 하나에서 Manager 가상 시스템을 수동으로 재부팅합니다.

    # hosted-engine --vm-shutdown
    # hosted-engine --vm-start
    참고

    자체 호스팅 엔진 노드가 글로벌 유지 관리 모드에 있는 경우 Manager 가상 시스템을 수동으로 재부팅해야 합니다. 명령줄에서 reboot 명령을 전송하여 Manager 가상 머신을 재부팅 하려고 하면 Manager 가상 시스템의 전원이 꺼집니다. 이것은 설계에 의한 것입니다.

  7. Manager 가상 머신에서 ovirt-engine 서비스가 실행 중인지 확인합니다.

     # systemctl status ovirt-engine.service
  8. Manager 가상 머신이 실행 중인지 확인한 후 콘솔 세션을 닫고 유지 관리 모드를 비활성화하여 HA 서비스를 다시 활성화합니다.

    # hosted-engine --set-maintenance --mode=none

엔진 상태: "vm": "down", "health": "bad", "detail": "unknown", "reason": "reason": "vm not running on this host""

  1. 사용자 환경에 호스트가 두 개 이상 있는 경우 다른 호스트가 현재 Manager 가상 머신을 재시작하지 않았는지 확인합니다.
  2. 전역 유지 관리 모드가 아닌지 확인합니다.
  3. /var/log/ovirt-hosted-engine-ha/agent.log 에서 ovirt-ha-agent 로그를 확인합니다.
  4. 셀프 호스트 엔진 노드 중 하나에서 Manager 가상 시스템을 수동으로 재부팅합니다.

    # hosted-engine --vm-shutdown
    # hosted-engine --vm-start

엔진 상태: "vm": "unknown", "health": "unknown", "detail": "unknown", "reason": "reason": "reason": "failed to getVmStats"

이 상태는 ovirt-ha-agent 가 VDSM에서 가상 시스템의 세부 정보를 가져오지 못했음을 의미합니다.

  1. /var/log/vdsm/vdsm.log 에서 VDSM 로그를 확인합니다.
  2. /var/log/ovirt-hosted-engine-ha/agent.log 에서 ovirt-ha-agent 로그를 확인합니다.

엔진 상태: 셀프 호스트 엔진의 구성이 공유 스토리지에서 검색되지 않았습니다.

상태가 수신되면 호스팅 엔진 구성이 공유 스토리지에서 검색되지 않았습니다. ovirt-ha-agent가 실행 중이고 스토리지 서버에 연결할 수 있는지 확인합니다.ovirt-ha-agent 서비스 또는 스토리지 또는 둘 다에 문제가 있는지 확인하십시오.

  1. 호스트에서 ovirt-ha-agent 의 상태를 확인합니다.

    # systemctl status -l ovirt-ha-agent
    # journalctl -u ovirt-ha-agent
  2. ovirt-ha-agent 가 down된 경우 다시 시작합니다.

    # systemctl start ovirt-ha-agent
  3. /var/log/ovirt-hosted-engine-ha/agent.log 에서 ovirt-ha-agent 로그를 확인합니다.
  4. 공유 스토리지를 ping할 수 있는지 확인합니다.
  5. 공유 스토리지가 마운트되었는지 확인합니다.

추가 문제 해결 명령

중요

자체 호스팅 엔진 환경의 문제를 해결하기 위해 이러한 명령을 실행해야 하는 경우 Red Hat 지원 팀에 문의하십시오.

  • hosted-engine --reinitialize-lockspace: 이 명령은 잠금 잠금 공간이 손상될 때 사용됩니다. 잠금 잠금 공간을 다시 초기화하기 전에 글로벌 유지 관리 모드가 활성화되어 있고 Manager 가상 시스템이 중지되었는지 확인하십시오.
  • hosted-engine --clean-metadata: 글로벌 상태 데이터베이스에서 호스트의 에이전트 메타데이터를 제거합니다. 그러면 다른 모든 호스트가 이 호스트를 잊어버렸습니다. 대상 호스트가 다운되어 글로벌 유지 관리 모드가 활성화되어 있는지 확인합니다.
  • hosted-engine --check-livelines: 이 명령은 ovirt-engine 서비스의 라이브 줄 페이지를 확인합니다. 웹 브라우저에서 https://engine-fqdn/ovirt-engine/services/health/ 에 연결하여 확인할 수도 있습니다.
  • hosted-engine --connect-storage: 이 명령은 VDSM에 호스트 및 Manager 가상 시스템에 필요한 모든 스토리지 연결을 준비하도록 지시합니다. 이는 일반적으로 자체 호스팅 엔진 배포 중에 백엔드에서 실행됩니다. 스토리지 문제를 해결하기 위해 이 명령을 실행해야 하는 경우 글로벌 유지 관리 모드가 활성화되어 있는지 확인합니다.