第 14 章 监控 Data Grid 服务

Data Grid 会公开指标数据,供 Prometheus 和 Grafana 用于监控和视觉化集群状态。

注意

本文档解释了如何在 OpenShift Container Platform 中设置监控。如果您正在使用社区 Prometheus 部署,您可能会发现这些说明作为一个常规指南很有用。但是,您应该参阅 Prometheus 文档以了解安装和使用说明。

请参阅 Prometheus Operator 文档。

14.1. 创建 Prometheus 服务监控器

data Grid Operator 会自动创建一个 Prometheus ServiceMonitor,从您的 Data Grid 集群中提取指标。

流程

在 OpenShift Container Platform 上为用户定义的项目启用监控。

当 Operator 检测到 Infinispan CR 时,监控注解设置为 true 时,Data Grid Operator 会进行以下操作:

  • 创建名为 < cluster_name>-monitorServiceMonitor
  • 如果还没有显式设置值,将 infinispan.org/monitoring: 'true' 注解添加到 Infinispan CR 元数据中:

    apiVersion: infinispan.org/v1
    kind: Infinispan
    metadata:
      name: infinispan
      annotations:
        infinispan.org/monitoring: 'true'
注意

要通过 Data Grid 进行身份验证,Prometheus 使用 operator 凭证。

验证

您可以检查 Prometheus 是否提取 Data Grid 指标,如下所示:

  1. 在 OpenShift Web 控制台中,选择 &lt ;/> Developer 视角,然后选择 Monitoring
  2. 为您的 Data Grid 集群运行的命名空间打开 Dashboard 标签页。
  3. 打开 Metrics 选项卡,并确认您可以查询 Data Grid 指标,例如:

    vendor_cache_manager_default_cluster_size

14.1.1. 禁用 Prometheus 服务监控器

如果您不希望 Prometheus 为 Data Grid 集群提取指标,可以禁用 ServiceMonitor

流程

  1. Infinispan CR 中,将 'false' 设置为 infinispan.org/monitoring 注解的值。

    apiVersion: infinispan.org/v1
    kind: Infinispan
    metadata:
      name: infinispan
      annotations:
        infinispan.org/monitoring: 'false'
  2. 应用更改。