Jump To Close Expand all Collapse all Table of contents 故障排除指南 1. 初始故障排除 Expand section "1. 初始故障排除" Collapse section "1. 初始故障排除" 1.1. 先决条件 1.2. 识别问题 1.3. 诊断存储集群的健康状况 1.4. 了解 Ceph 的健康状态 1.5. 变异 Ceph 集群的健康警报 1.6. 了解 Ceph 日志 1.7. 生成 sos 报告 2. 配置日志记录 Expand section "2. 配置日志记录" Collapse section "2. 配置日志记录" 2.1. 先决条件 2.2. Ceph 子系统 2.3. 在运行时配置日志记录 2.4. 配置登录配置文件 2.5. 加快日志轮转 2.6. 为 Ceph 对象网关创建和收集操作日志 3. 网络问题故障排除 Expand section "3. 网络问题故障排除" Collapse section "3. 网络问题故障排除" 3.1. 先决条件 3.2. 基本网络故障排除 3.3. 基本 chrony NTP 故障排除 4. Ceph 监控器故障排除 Expand section "4. Ceph 监控器故障排除" Collapse section "4. Ceph 监控器故障排除" 4.1. 先决条件 4.2. 大多数常见 Ceph 监控错误 Expand section "4.2. 大多数常见 Ceph 监控错误" Collapse section "4.2. 大多数常见 Ceph 监控错误" 4.2.1. 先决条件 4.2.2. Ceph 监控错误消息 4.2.3. Ceph 日志中的通用 Ceph monitor 错误消息 4.2.4. Ceph monitor 超出仲裁数 4.2.5. Clock skew 4.2.6. Ceph 监控器存储太大 4.2.7. 了解 Ceph 监控状态 4.2.8. 其它资源 4.3. 注入 monmap 4.4. 替换失败的 monitor 4.5. 压缩 monitor 存储 4.6. 为 Ceph Manager 打开端口 4.7. 恢复 Ceph 监控存储 Expand section "4.7. 恢复 Ceph 监控存储" Collapse section "4.7. 恢复 Ceph 监控存储" 4.7.1. 使用 BlueStore 时恢复 Ceph monitor 存储 4.8. 其它资源 5. Ceph OSD 故障排除 Expand section "5. Ceph OSD 故障排除" Collapse section "5. Ceph OSD 故障排除" 5.1. 先决条件 5.2. 大多数常见 Ceph OSD 错误 Expand section "5.2. 大多数常见 Ceph OSD 错误" Collapse section "5.2. 大多数常见 Ceph OSD 错误" 5.2.1. 先决条件 5.2.2. Ceph OSD 错误消息 5.2.3. Ceph 日志中的常见 Ceph OSD 错误消息 5.2.4. OSD 已满 5.2.5. backfillfull OSD 5.2.6. nearfull OSD 5.2.7. OSD 下线 5.2.8. Flapping OSD 5.2.9. 请求慢或请求被阻塞 5.3. 停止并启动重新平衡 5.4. 替换 OSD 驱动器 5.5. 增加 PID 数量 5.6. 从完整存储集群中删除数据 6. 多站点 Ceph 对象网关故障排除 Expand section "6. 多站点 Ceph 对象网关故障排除" Collapse section "6. 多站点 Ceph 对象网关故障排除" 6.1. 先决条件 6.2. Ceph 对象网关的代码定义错误 6.3. 同步多站点 Ceph 对象网关 Expand section "6.3. 同步多站点 Ceph 对象网关" Collapse section "6.3. 同步多站点 Ceph 对象网关" 6.3.1. 执行多站点 Ceph 对象网关的数据同步的计数器 6.4. 在多站点 Ceph 对象网关配置中同步数据 7. 对 Ceph iSCSI 网关(有限的可用性)进行故障排除 Expand section "7. 对 Ceph iSCSI 网关(有限的可用性)进行故障排除" Collapse section "7. 对 Ceph iSCSI 网关(有限的可用性)进行故障排除" 7.1. 先决条件 7.2. 为丢失的连接收集信息会导致 VMware ESXi 上的存储失败 7.3. 检查 iSCSI 登录失败,因为未发送数据 7.4. 检查 iSCSI 登录失败,因为超时或无法找到门户组 7.5. timeout 命令错误 7.6. Abort 任务错误 7.7. 其它资源 8. Ceph 放置组故障排除 Expand section "8. Ceph 放置组故障排除" Collapse section "8. Ceph 放置组故障排除" 8.1. 先决条件 8.2. 大多数常见的 Ceph 放置组错误 Expand section "8.2. 大多数常见的 Ceph 放置组错误" Collapse section "8.2. 大多数常见的 Ceph 放置组错误" 8.2.1. 先决条件 8.2.2. 放置组错误消息 8.2.3. Stale 放置组 8.2.4. Inconsistent placement groups 8.2.5. unclean PG 8.2.6. 不活跃的放置组 8.2.7. 放置组停机 8.2.8. Unfound objects 8.3. 列出 PG 停留在 stale、inactive 或 unclean 状态 8.4. 列出放置组不一致 8.5. 修复不一致的放置组 8.6. 增加放置组 8.7. 其它资源 9. Ceph 对象故障排除 Expand section "9. Ceph 对象故障排除" Collapse section "9. Ceph 对象故障排除" 9.1. 先决条件 9.2. 高级对象操作故障排除 Expand section "9.2. 高级对象操作故障排除" Collapse section "9.2. 高级对象操作故障排除" 9.2.1. 先决条件 9.2.2. 列出对象 9.2.3. 修复丢失的对象 9.3. 低级对象操作故障排除 Expand section "9.3. 低级对象操作故障排除" Collapse section "9.3. 低级对象操作故障排除" 9.3.1. 先决条件 9.3.2. 操作对象的内容 9.3.3. 删除对象 9.3.4. 列出对象映射 9.3.5. 操作对象映射标头 9.3.6. 操作对象映射密钥 9.3.7. 列出对象的属性 9.3.8. 操作对象属性键 9.4. 其它资源 10. 对处于扩展模式的集群进行故障排除 Expand section "10. 对处于扩展模式的集群进行故障排除" Collapse section "10. 对处于扩展模式的集群进行故障排除" 10.1. 将 tiebreaker 替换为仲裁中的 monitor 10.2. 使用新监控器替换 tiebreaker 10.3. 强制扩展集群到恢复或健康模式 11. 联系红帽支持服务 Expand section "11. 联系红帽支持服务" Collapse section "11. 联系红帽支持服务" 11.1. 先决条件 11.2. 为红帽支持工程师提供信息 11.3. 生成可读的核心转储文件 Expand section "11.3. 生成可读的核心转储文件" Collapse section "11.3. 生成可读的核心转储文件" 11.3.1. 先决条件 11.3.2. 在容器化部署中生成可读的核心转储文件 11.3.3. 其它资源 A. Ceph 子系统默认日志记录级别值 B. Ceph 集群的运行状况消息 法律通告 Settings Close Language: 日本語 简体中文 한국어 English Language: 日本語 简体中文 한국어 English Format: Multi-page Single-page Format: Multi-page Single-page Language and Page Formatting Options Language: 日本語 简体中文 한국어 English Language: 日本語 简体中文 한국어 English Format: Multi-page Single-page Format: Multi-page Single-page 第 4 章 Ceph 监控器故障排除 本章包含关于如何修复与 Ceph 监控器相关的最常见错误的信息。 4.1. 先决条件 验证网络连接。 Previous Next