第 1 章 监控概述

1.1. 关于 OpenShift Container Platform 监控

OpenShift Container Platform 包括一个预配置、预安装和自我更新的监控堆栈,可为核心平台组件提供监控。您还可以选择 为用户定义的项目启用监控

集群管理员可以使用支持的配置 配置监控堆栈。OpenShift Container Platform 提供了与监控相关的现成的最佳实践。

其中默认包括一组警报,可立即就集群问题通知集群管理员。OpenShift Container Platform Web 控制台中的默认仪表板包括集群指标的直观表示,以帮助您快速了解集群状态。

使用 OpenShift Container Platform Web 控制台,您可以 查看和管理指标警报并查看监控仪表板。OpenShift Container Platform 还提供 对第三方接口 (如 Prometheus、Alertmanager 和 Grafana)的访问。

安装 OpenShift Container Platform 4.6 后,集群管理员可以选择性地为用户定义的项目启用监控。通过使用此功能,集群管理员、开发人员和其他用户可以指定在其自己的项目中如何监控服务和 Pod。您还可以 公开用于 Pod 横向自动扩展的自定义应用程序指标。作为集群管理员,您可以查找常见问题的答案,如用户指标不可用,Prometheus 在 对监控问题进行故障排除时 消耗了大量磁盘空间。