8.8. 从 OSD 节点上的操作系统升级失败中恢复

作为系统管理员,如果您在使用手动升级 Ceph OSD 节点及其操作系统的步骤时失败,您可以按照以下步骤从故障中恢复:在该过程中,您将在节点上全新安装 Red Hat Enterprise Linux 8.4,并且仍然能够恢复 OSD,而不必回填数据,除了写入到它们已停机的 OSD 外。

重要

不要触动支持 OSD 或对应的 wal.dbblock.db 数据库的介质。

先决条件

  • 一个正在运行的 Red Hat Ceph Storage 集群。
  • 升级失败的 OSD 节点。
  • 访问 Red Hat Enterprise Linux 8.4 安装源。

流程

  1. 在失败节点中执行 Red Hat Enterprise Linux 8.4 标准安装并启用 Red Hat Enterprise Linux 软件仓库。

  2. 为 Red Hat Enterprise Linux 8 启用 Red Hat Ceph Storage 4 的软件仓库。

    1. 启用工具存储库:

      # subscription-manager repos --enable=rhceph-4-tools-for-rhel-8-x86_64-rpms
    2. 启用 osd 存储库:

      # subscription-manager repos --enable=rhceph-4-osd-for-rhel-8-x86_64-rpms
  3. 安装 ceph-osd 软件包:

    # dnf install ceph-osd
  4. ceph.conf 文件从尚未升级的节点或已经恢复这些文件的节点恢复到 /etc/ceph
  5. 启动 OSD 服务:

    # systemctl start ceph-osd.target
  6. 激活对象存储设备:

    ceph-volume lvm activate --all
  7. 观察 OSD 的恢复和集群回填写入恢复的 OSD:

    # ceph -w

    监控输出,直到所有 PG 都处于 active+clean 状态。