26.5. 节点置备故障排除

OpenStack Orchestration (heat) 服务控制置备过程。如果节点置备失败,则使用 OpenStack 客户端和服务日志文件诊断问题。

步骤

  1. source stackrc 文件:

    $ source ~/stackrc
  2. 检查裸机恢复服务以查看所有注册节点及其当前状态:

    (undercloud) $ openstack baremetal node list
    
    +----------+------+---------------+-------------+-----------------+-------------+
    | UUID     | Name | Instance UUID | Power State | Provision State | Maintenance |
    +----------+------+---------------+-------------+-----------------+-------------+
    | f1e261...| None | None          | power off   | available       | False       |
    | f0b8c1...| None | None          | power off   | available       | False       |
    +----------+------+---------------+-------------+-----------------+-------------+

    可用于置备的所有节点都应设置以下状态:

    • Maintenance 设置为 False
    • 在置备前,Provision State 设置为 available

    下表概述一些常见置备失败情境。

问题原因解决方案

Maintenance 自动将自身设置为 True

director 无法访问节点的电源管理。

检查节点电源管理的凭据。

Provision State 设置为 available,但节点未置备。

此问题在启动裸机部署前发生。

检查包括配置集和类别映射的节点详细信息。检查节点硬件详细信息是否在该类别的要求内。

节点的 Provision State 设置为 wait call-back

此节点的节点置备过程尚未完成。

等到此状态更改。否则,连接到节点的虚拟控制台并检查输出。

Provision State 处于 activePower State 处于 power on,但节点无响应。

节点置备已成功完成,并在部署后配置步骤中出问题。

诊断节点配置过程。连接到节点的虚拟控制台并检查输出。

Provision Stateerrordeploy failed

节点置备已失败。

使用 openstack baremetal node show 命令查看裸机节点详细信息,并检查 last_error 字段,其中包含错误说明。