1.3. 诊断存储集群的健康状况

此流程列出了诊断 Red Hat Ceph Storage 集群健康状况的基本步骤。

先决条件

  • 一个正在运行的 Red Hat Ceph Storage 集群。

流程

  1. 登录到 Cephadm shell:

    示例

    [root@host01 ~]# cephadm shell

  2. 检查存储集群的整体状态:

    示例

    [ceph: root@host01 /]# ceph health detail

    如果命令返回 HEALTH_WARN 或 HEALTH_ERR,请参见 了解 Ceph 健康状况 以了解详细信息。

  3. 监控存储集群的日志:

    示例

    [ceph: root@host01 /]# ceph -W cephadm

  4. 要将集群日志捕获到文件中,请运行以下命令:

    示例

    [ceph: root@host01 /]# ceph config set global log_to_file true
    [ceph: root@host01 /]# ceph config set global mon_cluster_log_to_file true

    日志默认位于 /var/log/ceph/CLUSTER_FSID/ 目录中。检查 Ceph 日志,以了解 了解 Ceph 日志 中列出的任何错误消息。

  5. 如果日志没有包括足够数量的信息,请提高调试级别,并尝试重现失败的操作。详情请参阅 配置日志