28.10. Compute 节点故障排除

Compute 节点使用 Compute 服务来执行基于虚拟机监控程序的操作。这意味着,对 Compute 节点进行故障排除可以解决与这个服务相关的问题。

步骤

  1. Source stackrc 文件:

    $ source ~/stackrc
  2. 获取包含故障的 Compute 节点的 IP 地址:

    (undercloud) $ openstack server list
  3. 登录该节点:

    (undercloud) $ ssh heat-admin@192.168.24.60
  4. 切换到 root 用户:

    $ sudo -i
  5. 查看容器状态:

    $ sudo podman ps -f name=nova_compute
  6. Compute 节点的主日志文件为 /var/log/containers/nova/nova-compute.log。如果 Compute 节点通信出现问题,请使用此文件开始诊断。
  7. 如果需要在 Compute 节点上进行维护工作,把主机上存在的实例迁移到另外一个可以正常工作的 Compute 节点上,然后禁用需要进行维护的节点。