3.3.22. 找出卡住的 PG

如前所述,放置组不一定存在问题,因为它的状态不是 活动+clean。通常,当放置组卡时,Ceph 自助修复的能力可能无法工作。卡住状态包括:

  • Unclean: 放置组包含不会复制所需次数的对象。它们应该正在进行恢复。
  • Inactive :放置组无法处理读取或写入,因为它们正在等待具有最新数据的 OSD 返回到 up 状态。
  • Stale:放置组处于未知状态,因为托管它们的 OSD 在一段时间内未报告到监控集群,并可使用 mon osd report timeout 配置。

先决条件

  • 一个正在运行的 Red Hat Ceph Storage 集群。
  • 节点的根级别访问权限。

流程

  1. 要识别卡的放置组,请执行以下操作:

    ceph pg dump_stuck {inactive|unclean|stale|undersized|degraded [inactive|unclean|stale|undersized|degraded...]} {<int>}