7.4. 将 OSD 报告为 down

默认情况下,来自不同主机的两个 Ceph OSD 守护进程必须报告给另一个 Ceph OSD 守护进程处于 down 状态的 Ceph 监控器,然后确认报告的 Ceph OSD 守护进程为 down

但是,所有 OSD 报告失败的可能性都位于具有错误交换机的机架中,导致 OSD 之间的连接问题。

为避免"错误警报",Ceph 会将故障报告为类似 lagy 的"subcluster"的代理。虽然情况并非总是如此,但可能帮助管理员对性能不良的系统子集进行本地化处理。

Ceph 使用 mon_osd_reporter_subtree_level 设置,将 peer 分到"cluster"的常用级别类型。

默认情况下,仅需要两个来自不同子树的报告,才能报告另一个 Ceph OSD 守护进程为 down。管理员可以通过在运行时设置 mon_osd_min_down_reportersmon_osd_reporter_subtree_level 的值,修改报告者的数量,将用于报告一个 Ceph OSD Daemon down 所需的唯一的子树和祖先类型改为 Ceph Monitor:

语法

ceph config set mon mon_osd_min_down_reporters NUMBER

示例

[ceph: root@host01 /]# ceph config set mon mon_osd_min_down_reporters 4

语法

ceph config set mon mon_osd_reporter_subtree_level CRUSH_ITEM

示例

[ceph: root@host01 /]# ceph config set mon mon_osd_reporter_subtree_level host
[ceph: root@host01 /]# ceph config set mon mon_osd_reporter_subtree_level rack
[ceph: root@host01 /]# ceph config set mon mon_osd_reporter_subtree_level osd

报告故障 OSD