第 14 章 监控 Data Grid 服务
Data Grid 会公开指标数据,供 Prometheus 和 Grafana 用于监控和视觉化集群状态。
本文档解释了如何在 OpenShift Container Platform 中设置监控。如果您正在使用社区 Prometheus 部署,您可能会发现这些说明作为一个常规指南很有用。但是,您应该参阅 Prometheus 文档以了解安装和使用说明。
请参阅 Prometheus Operator 文档。
14.1. 创建 Prometheus 服务监控器
data Grid Operator 会自动创建一个 Prometheus ServiceMonitor
,从您的 Data Grid 集群中提取指标。
流程
在 OpenShift Container Platform 上为用户定义的项目启用监控。
当 Operator 检测到 Infinispan
CR 时,监控注解设置为 true
时,Data Grid Operator 会进行以下操作:
-
创建名为 <
cluster_name>-monitor
的ServiceMonitor
。 如果还没有显式设置值,将
infinispan.org/monitoring: 'true'
注解添加到Infinispan
CR 元数据中:apiVersion: infinispan.org/v1 kind: Infinispan metadata: name: infinispan annotations: infinispan.org/monitoring: 'true'
要通过 Data Grid 进行身份验证,Prometheus 使用 operator
凭证。
验证
您可以检查 Prometheus 是否提取 Data Grid 指标,如下所示:
- 在 OpenShift Web 控制台中,选择 < ;/> Developer 视角,然后选择 Monitoring。
- 为您的 Data Grid 集群运行的命名空间打开 Dashboard 标签页。
打开 Metrics 选项卡,并确认您可以查询 Data Grid 指标,例如:
vendor_cache_manager_default_cluster_size
其他资源
14.1.1. 禁用 Prometheus 服务监控器
如果您不希望 Prometheus 为 Data Grid 集群提取指标,可以禁用 ServiceMonitor
。
流程
在
Infinispan
CR 中,将'false'
设置为infinispan.org/monitoring
注解的值。apiVersion: infinispan.org/v1 kind: Infinispan metadata: name: infinispan annotations: infinispan.org/monitoring: 'false'
- 应用更改。