6.2. 解决集群健康问题

Red Hat Ceph Storage 可以在 OpenShift Data Foundation 用户界面中引发该显示的一系列有限健康消息。它们定义为具有唯一标识符的健康检查。标识符是一个制表伪可读字符串,旨在使工具能够理解健康检查,并以反应其含义的方式呈现它们。有关更多信息和故障排除,请单击下面的健康代码。

健康代码描述

MON_DISK_LOW

一个或多个 Ceph 监控器在磁盘空间上较低。

6.2.1. MON_DISK_LOW

如果将 monitor 数据库存储为百分比的文件系统中的可用空间下降到 mon_data_avail_warn 下,则会触发此警报(默认:15%)。这可能表明系统上的某些其他进程或用户正在填满监控器使用的相同文件系统。也可能表明监控器的数据库比较大。

注意

文件系统的路径因您的 mon 部署而异。您可以找到在 storagecluster.yaml 中部署 mon 的路径。

路径示例:

  • 通过 PVC 路径部署的 mon: /var/lib/ceph/mon
  • 通过 hostpath 部署 mon: /var/lib/rook/mon

若要清除空间,请查看文件系统中的高使用量文件并选择要删除的文件。要查看文件,请运行:

# du -a <path-in-the-mon-node> |sort -n -r |head -n10

<path-in-the-mon-node> 替换为部署 mons 的文件系统的路径。