Red Hat Training

A Red Hat training course is available for Red Hat Ceph Storage

4.4. 替换失败的 monitor

当 monitor 具有损坏的存储时,建议通过利用 Ansible 自动化应用来替换 monitor。

开始前

  • 在删除 monitor 之前,请确保其他 monitor 正在运行并且能够形成仲裁。

步骤: 替换失败的 monitor

  1. 在 monitor 主机上,默认删除位于 /var/lib/ceph/mon/<cluster-name>-<short-host-name> 的 monitor 存储:

    rm -rf /var/lib/ceph/mon/<cluster-name>-<short-host-name>

    指定 monitor 主机的简短主机名和集群名称。例如,要从名为 remote 的集群中删除 host1 上运行的 monitor 存储:

    # rm -rf /var/lib/ceph/mon/remote-host1
  2. 从 monitor map(monmap)中删除 monitor:

    ceph mon remove <short-host-name> --cluster <cluster-name>

    指定 monitor 主机的简短主机名和集群名称。例如,要从名为 remote 的集群中删除 host1 上运行的 monitor:

    # ceph mon remove host1 --cluster remote
  3. 排除故障并修复与 monitor 主机底层文件系统或硬件相关的问题。
  4. 在 Ansible 管理节点中,通过运行 ceph-ansible playbook 来重新部署 monitor:

    $ /usr/share/ceph-ansible/ansible-playbook site.yml

另请参阅