Jump To Close Expand all Collapse all Table of contents 监控 1. 监控概述 Expand section "1. 监控概述" Collapse section "1. 监控概述" 1.1. 关于 OpenShift Container Platform 监控 1.2. 了解监控堆栈 Expand section "1.2. 了解监控堆栈" Collapse section "1.2. 了解监控堆栈" 1.2.1. 默认监控组件 1.2.2. 默认监控目标 1.2.3. 用于监控用户定义的项目的组件 1.2.4. 用户定义的项目的监控目标 1.3. OpenShift Container Platform 监控的常见术语表 1.4. 其他资源 1.5. 后续步骤 2. 配置监控堆栈 Expand section "2. 配置监控堆栈" Collapse section "2. 配置监控堆栈" 2.1. 先决条件 2.2. 对监控的维护和支持 Expand section "2.2. 对监控的维护和支持" Collapse section "2.2. 对监控的维护和支持" 2.2.1. 对监控的支持注意事项 2.2.2. 监控 Operator 的支持策略 2.3. 准备配置监控堆栈 Expand section "2.3. 准备配置监控堆栈" Collapse section "2.3. 准备配置监控堆栈" 2.3.1. 创建集群监控配置映射 2.3.2. 创建用户定义的工作负载监控配置映射 2.4. 配置监控堆栈 2.5. 可配置的监控组件 2.6. 使用节点选择器移动监控组件 Expand section "2.6. 使用节点选择器移动监控组件" Collapse section "2.6. 使用节点选择器移动监控组件" 2.6.1. 节点选择器与其他约束一起使用 2.6.2. 将监控组件移到其他节点 2.7. 为监控组件分配容忍(tolerations) 2.8. 为指标提取设置正文大小限制 2.9. 配置专用服务监控器 Expand section "2.9. 配置专用服务监控器" Collapse section "2.9. 配置专用服务监控器" 2.9.1. 启用专用服务监控器 2.10. 配置持久性存储 Expand section "2.10. 配置持久性存储" Collapse section "2.10. 配置持久性存储" 2.10.1. 持久性存储的先决条件 2.10.2. 配置本地持久性卷声明 2.10.3. 重新定义持久性存储卷的大小 2.10.4. 修改 Prometheus 指标数据的保留时间和大小 2.10.5. 修改 Thanos Ruler 指标数据的保留时间 2.11. 配置远程写入存储 Expand section "2.11. 配置远程写入存储" Collapse section "2.11. 配置远程写入存储" 2.11.1. 支持的远程写入身份验证设置 2.11.2. 远程写入身份验证设置示例 2.12. 在指标中添加集群 ID 标签 Expand section "2.12. 在指标中添加集群 ID 标签" Collapse section "2.12. 在指标中添加集群 ID 标签" 2.12.1. 为指标创建集群 ID 标签 2.13. 配置指标集合配置集 Expand section "2.13. 配置指标集合配置集" Collapse section "2.13. 配置指标集合配置集" 2.13.1. 关于指标集合配置集 2.13.2. 选择指标集合配置集 2.14. 控制用户定义的项目中未绑定指标属性的影响 Expand section "2.14. 控制用户定义的项目中未绑定指标属性的影响" Collapse section "2.14. 控制用户定义的项目中未绑定指标属性的影响" 2.14.1. 为用户定义的项目设置提取示例和标签限制 2.14.2. 创建提取示例警报 3. 配置外部 Alertmanager 实例 4. 为 Alertmanager 配置 secret Expand section "4. 为 Alertmanager 配置 secret" Collapse section "4. 为 Alertmanager 配置 secret" 4.1. 在 Alertmanager 配置中添加 secret 4.2. 在时间序列和警报中附加额外标签 5. 为监控配置 pod 拓扑分布限制 Expand section "5. 为监控配置 pod 拓扑分布限制" Collapse section "5. 为监控配置 pod 拓扑分布限制" 5.1. 为 Prometheus 设置 pod 拓扑分布限制 5.2. 为 Alertmanager 设置 pod 拓扑分布限制 5.3. 为 Thanos Ruler 设置 pod 拓扑分布限制 5.4. 为监控组件设置日志级别 5.5. 为 Prometheus 启用查询日志文件 5.6. 为 Thanos Querier 启用查询日志记录 6. 为 Prometheus Adapter 设置审计日志级别 Expand section "6. 为 Prometheus Adapter 设置审计日志级别" Collapse section "6. 为 Prometheus Adapter 设置审计日志级别" 6.1. 禁用本地 Alertmanager 6.2. 后续步骤 7. 为用户定义的项目启用监控 Expand section "7. 为用户定义的项目启用监控" Collapse section "7. 为用户定义的项目启用监控" 7.1. 为用户定义的项目启用监控 7.2. 授予用户权限来监控用户定义的项目 Expand section "7.2. 授予用户权限来监控用户定义的项目" Collapse section "7.2. 授予用户权限来监控用户定义的项目" 7.2.1. 使用 Web 控制台授予用户权限 7.2.2. 使用 CLI 授予用户权限 7.3. 授予用户权限来为用户定义的项目配置监控 7.4. 从集群外部访问自定义应用程序的指标 7.5. 将用户定义的项目从监控中排除 7.6. 为用户定义的项目禁用监控 7.7. 后续步骤 8. 为用户定义的项目启用警报路由 Expand section "8. 为用户定义的项目启用警报路由" Collapse section "8. 为用户定义的项目启用警报路由" 8.1. 了解用户定义的项目的警报路由 8.2. 为用户定义的警报路由启用平台 Alertmanager 实例 8.3. 为用户定义的警报路由启用一个单独的 Alertmanager 实例 8.4. 授予用户权限来为用户定义的项目配置警报路由 8.5. 后续步骤 9. 管理指标 Expand section "9. 管理指标" Collapse section "9. 管理指标" 9.1. 了解指标 9.2. 为用户定义的项目设置指标集合 Expand section "9.2. 为用户定义的项目设置指标集合" Collapse section "9.2. 为用户定义的项目设置指标集合" 9.2.1. 部署示例服务 9.2.2. 指定如何监控服务 9.3. 查看可用指标列表 9.4. 查询指标 Expand section "9.4. 查询指标" Collapse section "9.4. 查询指标" 9.4.1. 以集群管理员身份查询所有项目的指标 9.4.2. 以开发者身份查询用户定义的项目的指标 9.5. 获取有关指标目标的详细信息 10. 管理警报 Expand section "10. 管理警报" Collapse section "10. 管理警报" 10.1. 在 Administrator 和 Developer 视角中访问 Alerting UI 10.2. 搜索和过滤警报、静默和警报规则 10.3. 获取关于警报、静默和警报规则的信息 10.4. 管理静默 Expand section "10.4. 管理静默" Collapse section "10.4. 管理静默" 10.4.1. 静默警报 10.4.2. 编辑静默 10.4.3. 使静默到期 10.5. 为用户定义的项目管理警报规则 Expand section "10.5. 为用户定义的项目管理警报规则" Collapse section "10.5. 为用户定义的项目管理警报规则" 10.5.1. 为用户定义的项目优化警报 10.5.2. 关于为用户定义的项目创建警报规则 10.5.3. 为用户定义的项目创建警报规则 10.5.4. 访问用户定义的项目的警报规则 10.5.5. 在单个视图中列出所有项目的警报规则 10.5.6. 为用户定义的项目删除警报规则 10.6. 管理用于核心平台监控的警报规则 Expand section "10.6. 管理用于核心平台监控的警报规则" Collapse section "10.6. 管理用于核心平台监控的警报规则" 10.6.1. 修改核心平台警报规则 10.6.2. 创建新警报规则 10.7. 将通知发送到外部系统 Expand section "10.7. 将通知发送到外部系统" Collapse section "10.7. 将通知发送到外部系统" 10.7.1. 配置警报接收器 10.7.2. 为用户定义的项目创建警报路由 10.8. 应用自定义 Alertmanager 配置 10.9. 将自定义配置应用到 Alertmanager 以进行用户定义的警报路由 10.10. 后续步骤 11. 查看监控仪表板 Expand section "11. 查看监控仪表板" Collapse section "11. 查看监控仪表板" 11.1. 以集群管理员身份查看监控仪表板 11.2. 以开发者身份查看监控仪表板 11.3. 后续步骤 12. 使用 CLI 访问监控 API Expand section "12. 使用 CLI 访问监控 API" Collapse section "12. 使用 CLI 访问监控 API" 12.1. 关于访问监控 Web 服务 API 12.2. 访问监控 Web 服务 API 12.3. 使用 Prometheus 的联邦端点查询指标 12.4. 从集群外部访问自定义应用程序的指标 12.5. 其他资源 13. 监控问题的故障排除 Expand section "13. 监控问题的故障排除" Collapse section "13. 监控问题的故障排除" 13.1. 调查用户定义的项目指标不可用的原因 13.2. 确定为什么 Prometheus 消耗大量磁盘空间 14. Cluster Monitoring Operator 的配置映射引用 Expand section "14. Cluster Monitoring Operator 的配置映射引用" Collapse section "14. Cluster Monitoring Operator 的配置映射引用" 14.1. Cluster Monitoring Operator 配置参考 14.2. AdditionalAlertmanagerConfig Expand section "14.2. AdditionalAlertmanagerConfig" Collapse section "14.2. AdditionalAlertmanagerConfig" 14.2.1. 描述 14.2.2. 必需 14.3. AlertmanagerMainConfig Expand section "14.3. AlertmanagerMainConfig" Collapse section "14.3. AlertmanagerMainConfig" 14.3.1. 描述 14.4. AlertmanagerUserWorkloadConfig Expand section "14.4. AlertmanagerUserWorkloadConfig" Collapse section "14.4. AlertmanagerUserWorkloadConfig" 14.4.1. 描述 14.5. ClusterMonitoringConfiguration Expand section "14.5. ClusterMonitoringConfiguration" Collapse section "14.5. ClusterMonitoringConfiguration" 14.5.1. 描述 14.6. DedicatedServiceMonitors Expand section "14.6. DedicatedServiceMonitors" Collapse section "14.6. DedicatedServiceMonitors" 14.6.1. 描述 14.7. K8sPrometheusAdapter Expand section "14.7. K8sPrometheusAdapter" Collapse section "14.7. K8sPrometheusAdapter" 14.7.1. 描述 14.8. KubeStateMetricsConfig Expand section "14.8. KubeStateMetricsConfig" Collapse section "14.8. KubeStateMetricsConfig" 14.8.1. 描述 14.9. NodeExporterCollectorBuddyInfoConfig Expand section "14.9. NodeExporterCollectorBuddyInfoConfig" Collapse section "14.9. NodeExporterCollectorBuddyInfoConfig" 14.9.1. 描述 14.10. NodeExporterCollectorConfig Expand section "14.10. NodeExporterCollectorConfig" Collapse section "14.10. NodeExporterCollectorConfig" 14.10.1. 描述 14.11. NodeExporterCollectorCpufreqConfig Expand section "14.11. NodeExporterCollectorCpufreqConfig" Collapse section "14.11. NodeExporterCollectorCpufreqConfig" 14.11.1. 描述 14.12. NodeExporterCollectorNetClassConfig Expand section "14.12. NodeExporterCollectorNetClassConfig" Collapse section "14.12. NodeExporterCollectorNetClassConfig" 14.12.1. 描述 14.13. NodeExporterCollectorNetDevConfig Expand section "14.13. NodeExporterCollectorNetDevConfig" Collapse section "14.13. NodeExporterCollectorNetDevConfig" 14.13.1. 描述 14.14. NodeExporterCollectorTcpStatConfig Expand section "14.14. NodeExporterCollectorTcpStatConfig" Collapse section "14.14. NodeExporterCollectorTcpStatConfig" 14.14.1. 描述 14.15. NodeExporterConfig Expand section "14.15. NodeExporterConfig" Collapse section "14.15. NodeExporterConfig" 14.15.1. 描述 14.16. OpenShiftStateMetricsConfig Expand section "14.16. OpenShiftStateMetricsConfig" Collapse section "14.16. OpenShiftStateMetricsConfig" 14.16.1. 描述 14.17. PrometheusK8sConfig Expand section "14.17. PrometheusK8sConfig" Collapse section "14.17. PrometheusK8sConfig" 14.17.1. 描述 14.18. PrometheusOperatorConfig Expand section "14.18. PrometheusOperatorConfig" Collapse section "14.18. PrometheusOperatorConfig" 14.18.1. 描述 14.19. PrometheusRestrictedConfig Expand section "14.19. PrometheusRestrictedConfig" Collapse section "14.19. PrometheusRestrictedConfig" 14.19.1. 描述 14.20. RemoteWriteSpec Expand section "14.20. RemoteWriteSpec" Collapse section "14.20. RemoteWriteSpec" 14.20.1. 描述 14.20.2. 必需 14.21. TLSConfig Expand section "14.21. TLSConfig" Collapse section "14.21. TLSConfig" 14.21.1. 描述 14.21.2. 必需 14.22. TelemeterClientConfig Expand section "14.22. TelemeterClientConfig" Collapse section "14.22. TelemeterClientConfig" 14.22.1. 描述 14.22.2. 必需 14.23. ThanosQuerierConfig Expand section "14.23. ThanosQuerierConfig" Collapse section "14.23. ThanosQuerierConfig" 14.23.1. 描述 14.24. ThanosRulerConfig Expand section "14.24. ThanosRulerConfig" Collapse section "14.24. ThanosRulerConfig" 14.24.1. 描述 14.25. UserWorkloadConfiguration Expand section "14.25. UserWorkloadConfiguration" Collapse section "14.25. UserWorkloadConfiguration" 14.25.1. 描述 15. Cluster Observability Operator Expand section "15. Cluster Observability Operator" Collapse section "15. Cluster Observability Operator" 15.1. Cluster Observability Operator 发行注记 Expand section "15.1. Cluster Observability Operator 发行注记" Collapse section "15.1. Cluster Observability Operator 发行注记" 15.1.1. Cluster Observability Operator 0.1.3 Expand section "15.1.1. Cluster Observability Operator 0.1.3" Collapse section "15.1.1. Cluster Observability Operator 0.1.3" 15.1.1.1. 程序错误修复 15.1.2. Cluster Observability Operator 0.1.2 Expand section "15.1.2. Cluster Observability Operator 0.1.2" Collapse section "15.1.2. Cluster Observability Operator 0.1.2" 15.1.2.1. CVE 15.1.2.2. 程序错误修复 15.1.3. Cluster Observability Operator 0.1.1 Expand section "15.1.3. Cluster Observability Operator 0.1.1" Collapse section "15.1.3. Cluster Observability Operator 0.1.1" 15.1.3.1. 新功能及功能增强 15.1.4. Cluster Observability Operator 0.1 15.2. Cluster Observability Operator 概述 Expand section "15.2. Cluster Observability Operator 概述" Collapse section "15.2. Cluster Observability Operator 概述" 15.2.1. 了解 Cluster Observability Operator Expand section "15.2.1. 了解 Cluster Observability Operator" Collapse section "15.2.1. 了解 Cluster Observability Operator" 15.2.1.1. 使用 Cluster Observability Operator 的优点 15.3. 安装 Cluster Observability Operator Expand section "15.3. 安装 Cluster Observability Operator" Collapse section "15.3. 安装 Cluster Observability Operator" 15.3.1. 使用 Web 控制台卸载 Cluster Observability Operator 15.4. 配置 Cluster Observability Operator 以监控服务 Expand section "15.4. 配置 Cluster Observability Operator 以监控服务" Collapse section "15.4. 配置 Cluster Observability Operator 以监控服务" 15.4.1. 为 Cluster Observability Operator 部署示例服务 15.4.2. 指定 Cluster Observability Operator 如何监控服务 15.4.3. 为 Cluster Observability Operator 创建 MonitoringStack 对象 法律通告 Settings Close Language: 简体中文 한국어 日本語 English Language: 简体中文 한국어 日本語 English Format: Multi-page Single-page Format: Multi-page Single-page Language and Page Formatting Options Language: 简体中文 한국어 日本語 English Language: 简体中文 한국어 日本語 English Format: Multi-page Single-page Format: Multi-page Single-page 监控 OpenShift Container Platform 4.13在 OpenShift Container Platform 中配置和使用监控堆栈 Red Hat OpenShift Documentation Team法律通告摘要 本文提供有关在 OpenShift Container Platform 中配置和使用 Prometheus 监控堆栈的说明。 Next