第 5 章 监控用户定义的项目

5.1. 了解监控堆栈

在 OpenShift Dedicated 中,您可以从红帽站点可靠性工程师(SRE)平台指标隔离来监控您自己的项目。您可以监控自己的项目,而无需额外的监控解决方案。

注意

仔细阅读本文档中的说明,为监控用户定义的项目配置受支持的 Prometheus 实例。OpenShift Dedicated 不支持自定义 Prometheus 实例。

5.1.1. 了解监控堆栈

OpenShift Dedicated 监控堆栈基于 Prometheus 开源项目及其更广的生态系统。监控堆栈包括以下组件:

  • 默认平台监控组件。在 OpenShift Dedicated 安装过程中,一组平台监控组件会在 openshift-monitoring 项目中安装并默认启用。这为核心集群组件提供了监控功能。默认监控堆栈还为集群启用远程健康状态监控。CPU 和内存等关键指标从每个命名空间中的所有工作负载收集,并可用于您使用。

    下图中的默认安装部分说明了这些组件。

  • 用于监控用户定义项目的组件。此功能默认为启用,并为用户定义的项目提供监控。下图中的用户部分说明了这些组件。

5.1.1.1. 用于监控用户定义的项目的组件

OpenShift Dedicated 包括对监控堆栈的可选增强,供您用于监控用户定义的项目中的服务和 pod。此功能包括以下组件:

表 5.1. 用于监控用户定义的项目的组件

组件描述

Prometheus Operator

openshift-user-workload-monitoring 项目中的 Prometheus Operator 在同一项目中创建、配置和管理 Prometheus 和 Thanos Ruler 实例。

Prometheus

Prometheus 是为用户定义的项目提供监控的监控系统。Prometheus 将警报发送到 Alertmanager 进行处理。但是,目前还不支持警报路由。

Thanos Ruler

Thanos Ruler 是 Prometheus 的一个规则评估引擎,作为一个独立的进程来部署。在 OpenShift Dedicated 4 中,Thanos Ruler 为监控用户定义的项目提供规则和警报评估。

所有这些组件都由堆栈监控,并在 OpenShift Dedicated 更新时自动更新。

5.1.1.2. 用户定义的项目的监控目标

OpenShift Dedicated 用户定义的项目默认启用监控。您可以监控:

  • 通过用户定义的项目中的服务端点提供的指标。
  • 在用户定义的项目中运行的 Pod。

5.1.2. 其他资源

5.1.3. 后续步骤