Red Hat Training

A Red Hat training course is available for Red Hat OpenStack Platform

5.4. 重新引导计算 HCI 节点

以下流程重启计算超融合基础架构(HCI)节点。

流程

  1. 登录 Ceph MON 或 Controller 节点,并暂时禁用 Ceph Storage 集群重新平衡:

    $ sudo ceph osd set noout
    $ sudo ceph osd set norebalance
  2. stack 用户的身份登录 undercloud。
  3. 列出所有的 Compute 节点及其 UUID:

    $ source ~/stackrc
    (undercloud) $ openstack server list --name compute

    确定您要重新引导的 Compute 节点的 UUID。

  4. 在 undercloud 中,选择 Compute 节点并禁用它:

    $ source ~/overcloudrc
    (overcloud) $ openstack compute service list
    (overcloud) $ openstack compute service set [hostname] nova-compute --disable
  5. 列出 Compute 节点上的所有实例:

    (overcloud) $ openstack server list --host [hostname] --all-projects
  6. 使用以下命令之一迁移您的实例:

    1. 将实例迁移到您选择的特定主机:

      (overcloud) $ openstack server migrate [instance-id] --live [target-host]--wait
    2. nova-scheduler 自动选择目标主机:

      (overcloud) $ nova live-migration [instance-id]
    3. 一次性实时迁移所有实例:

      $ nova host-evacuate-live [hostname]
      注意

      nova 命令可能会引发一些弃用警告,这些警告信息可以被安全忽略。

  7. 等待迁移完成。
  8. 确认迁移成功完成:

    (overcloud) $ openstack server list --host [hostname] --all-projects
  9. 继续迁移实例,直到所选 Compute 节点中不剩任何实例。
  10. 登录到 Ceph MON 或 Controller 节点并检查集群状态:

    $ sudo ceph -s

    确认 pgmap 报告的所有 pgs 的状态是否都正常 (active+clean)。

  11. 重新引导 Compute HCI 节点:

    $ sudo reboot
  12. 稍等片刻,直到节点启动。
  13. 再次启用 Compute 节点:

    $ source ~/overcloudrc
    (overcloud) $ openstack compute service set [hostname] nova-compute --enable
  14. 验证 Compute 节点是否已启用:

    (overcloud) $ openstack compute service list
  15. 注销节点,重新引导下一个节点,并检查其状态。重复此流程,直到您已重新引导所有 Ceph 存储节点。
  16. 完成后,登录 Ceph MON 或 Controller 节点,然后再次启用集群重新平衡:

    $ sudo ceph osd unset noout
    $ sudo ceph osd unset norebalance
  17. 执行最后的状态检查,确认集群报告 HEALTH_OK

    $ sudo ceph status