Menu Close
Red Hat Training
A Red Hat training course is available for Red Hat Ceph Storage
3.3. 使用红帽 Ceph 存储仪表板监控 Ceph 存储集群
红帽 Ceph 存储控制面板提供监控仪表板,以视觉化 Ceph 存储群集的状态。此外,红帽 Ceph 存储控制面板架构为其他模块提供了框架,可以添加功能到存储集群。
- 要了解仪表板,请参阅 第 3.3.1 节 “Red Hat Ceph Storage Dashboard”。
- 要安装仪表板,请参阅 第 3.3.2 节 “安装 Red Hat Ceph Storage Dashboard”。
- 要访问仪表板,请参阅 第 3.3.3 节 “访问 Red Hat Ceph Storage Dashboard”。
- 要在安装 Dashboard 后更改默认密码,请参阅 第 3.3.4 节 “更改默认的 Red Hat Ceph Storage 仪表板密码”。
- 要了解 Prometheus 插件,请参阅 第 3.3.5 节 “Red Hat Ceph Storage 的 Prometheus 插件”。
- 要了解红帽 Ceph 存储仪表板警报以及如何配置警报,请参阅 第 3.3.6 节 “Red Hat Ceph Storage Dashboard 警告”。
先决条件
- 正在运行的 Red Hat Ceph Storage 集群
3.3.1. Red Hat Ceph Storage Dashboard
红帽 Ceph 存储控制面板为 Ceph 集群提供监控仪表板,以视觉化存储集群状态。控制面板可以从 Web 浏览器访问,提供有关集群状态、监控器、OSD、池或网络的多个指标和图表。
随着之前的 Red Hat Ceph Storage 版本,监控数据通过 collectd
插件提供,该插件将数据发送到 Graphite 监控工具的实例。从 Red Hat Ceph Storage 3.3 开始,使用 ceph-mgr
Prometheus 插件直接从 ceph-mgr
守护进程提供监控数据。
Prometheus 作为监控数据源,简化了红帽 Ceph 存储仪表板解决方案的部署和运营管理,同时减少了整体硬件要求。通过直接提供 Ceph 监控数据,红帽 Ceph 存储仪表板解决方案能更好地支持容器中部署的 Ceph 集群。
随着架构的这一改变,监控数据从红帽 Ceph 存储 2.x 和 3.0 到红帽 Ceph 存储 3.3 没有迁移路径。
Red Hat Ceph Storage 控制面板使用以下实用程序:
- 用于部署的 Ansible 自动化应用。
-
嵌入的 Prometheus
ceph-mgr
插件。 -
在存储集群的每个节点中运行的 Prometheus
node-exporter
守护进程。 - 用于提供用户界面和警报的 Grafana 平台。
Red Hat Ceph Storage Dashboard 支持以下功能:
- 常规功能
- 支持 Red Hat Ceph Storage 3.1 或更高版本
- SELinux 支持
- 支持 FileStore 和 BlueStore OSD 后端
- 支持加密和非加密的 OSD
- 支持 monitor、OSD、Ceph 对象网关和 iSCSI 角色
- 初始支持元数据服务器(MDS)
- 深度和仪表板链接
- 15 秒粒度
- 支持硬盘驱动器(HDD)、固态驱动器(SSD)、非易失性内存 Express(NVMe)接口和 Intel® 缓存加速软件(Intel® CAS)
- 节点指标
- CPU 和 RAM 使用量
- 网络负载
- 可配置警报
- 不使用(OOB)警报和触发器
- 通知频道在安装过程中自动定义
默认情况下创建的 Ceph Health Summary 仪表板
详情请参阅 Red Hat Ceph Storage Dashboard Alerts 部分。
- 集群摘要
- OSD 配置摘要
- OSD FileStore 和 BlueStore 概述
- 按角色分类的集群版本
- 磁盘大小摘要
- 按容量和磁盘数量的主机大小
- 放置组(PG)状态分类
- 池数
- 设备类摘要、HDD 与.SSD
- 集群详情
-
集群标志状态(
noout
、nodown
及其他) -
OSD 或 Ceph 对象网关主机
up
和down
状态 - 每个池容量使用量
- 原始容量利用率
- 活跃的清理和恢复过程的指标
- 增长跟踪和预测(原始容量)
-
有关
down
或near full
的 OSD 的信息,包括 OSD 主机和磁盘 - 每个 OSD 的 PG 分布
- OSD 按 PG 计数,突出显示已使用 OSD 的 over over 或 under 下
-
集群标志状态(
- OSD 性能
- 有关每秒 I/O 操作(IOPS)和池吞吐量的信息
- OSD 性能指标
- 每个 OSD 的磁盘统计信息
- 集群范围磁盘吞吐量
- 读/写比率(客户端 IOPS)
- 磁盘使用率 Heat 映射
- Ceph 角色的网络负载
- Ceph 对象网关详情
- 聚合的负载视图
- 每个主机延迟和吞吐量
- 按 HTTP 操作划分的工作负载
- Ceph iSCSI 网关详情
- 聚合视图
- 配置
- performance
- 每个网关资源使用率
- 每个客户端负载和配置
- 每个 Ceph 块设备镜像性能