8.3. 列出 PG 停留在 stale、inactive 或 unclean 状态

失败后,PG 会进入 降级peering 等状态。这个状态表示故障恢复过程的正常进度。

但是,如果 PG 处于这些状态之一的时间比预期长,则可能代表更大的问题。监控器报告当放置组处于不最佳状态。

Ceph 配置文件中的 mon_pg_stuck_threshold 选项决定了 PG 在多少秒之后被视为 不活动、未 清理过时

下表列出了这些状态及简短的说明:

状态它的含义大多数常见原因查看

Inactive

PG 尚未能够服务读/写请求。

  • 对等问题

不活跃的放置组

unclean

PG 包含的对象不会复制所需的次数。些情况阻止 PG 恢复。

  • unfound 对象
  • OSD 已 停机
  • 配置不正确

unclean PG

stale

ceph-osd 守护进程尚未更新 PG 的状态。

  • OSD 已 停机

Stale 放置组

先决条件

  • 一个正在运行的 Red Hat Ceph Storage 集群。
  • 节点的根级别访问权限。

流程

  1. 登录到 Cephadm shell:

    示例

    [root@host01 ~]# cephadm shell

  2. 列出卡住 PG:

    示例

    [ceph: root@host01 /]# ceph pg dump_stuck inactive
    [ceph: root@host01 /]# ceph pg dump_stuck unclean
    [ceph: root@host01 /]# ceph pg dump_stuck stale

其它资源

  • 请参阅 Red Hat Ceph Storage Administration Guide 中的 放置组状态 部分。