Jump To Close Expand all Collapse all Table of contents 监控 1. 监控概述 Expand section "1. 监控概述" Collapse section "1. 监控概述" 1.1. 关于 OpenShift Container Platform 监控 1.2. 了解监控堆栈 Expand section "1.2. 了解监控堆栈" Collapse section "1.2. 了解监控堆栈" 1.2.1. 默认监控组件 1.2.2. 默认监控目标 1.2.3. 用于监控用户定义的项目的组件 1.2.4. 用户定义的项目的监控目标 1.3. OpenShift Container Platform 监控的常见术语表 1.4. 其他资源 1.5. 后续步骤 2. 配置监控堆栈 Expand section "2. 配置监控堆栈" Collapse section "2. 配置监控堆栈" 2.1. 先决条件 2.2. 对监控的维护和支持 Expand section "2.2. 对监控的维护和支持" Collapse section "2.2. 对监控的维护和支持" 2.2.1. 对监控的支持注意事项 2.2.2. 监控 Operator 的支持策略 2.3. 准备配置监控堆栈 Expand section "2.3. 准备配置监控堆栈" Collapse section "2.3. 准备配置监控堆栈" 2.3.1. 创建集群监控配置映射 2.3.2. 创建用户定义的工作负载监控配置映射 2.4. 配置监控堆栈 2.5. 可配置的监控组件 2.6. 使用节点选择器移动监控组件 Expand section "2.6. 使用节点选择器移动监控组件" Collapse section "2.6. 使用节点选择器移动监控组件" 2.6.1. 节点选择器与其他约束一起使用 2.6.2. 将监控组件移到其他节点 2.7. 为监控组件分配容忍(tolerations) 2.8. 配置专用服务监控器 Expand section "2.8. 配置专用服务监控器" Collapse section "2.8. 配置专用服务监控器" 2.8.1. 启用专用服务监控器 2.9. 配置持久性存储 Expand section "2.9. 配置持久性存储" Collapse section "2.9. 配置持久性存储" 2.9.1. 持久性存储的先决条件 2.9.2. 配置本地持久性卷声明 2.9.3. 重新定义持久性存储卷的大小 2.9.4. 修改 Prometheus 指标数据的保留时间 2.9.5. 修改 Thanos Ruler 指标数据的保留时间 2.10. 配置远程写入存储 2.11. 控制用户定义的项目中未绑定指标属性的影响 Expand section "2.11. 控制用户定义的项目中未绑定指标属性的影响" Collapse section "2.11. 控制用户定义的项目中未绑定指标属性的影响" 2.11.1. 为用户定义的项目设置提取示例限制 2.11.2. 创建提取示例警报 3. 配置外部 alertmanager 实例 Expand section "3. 配置外部 alertmanager 实例" Collapse section "3. 配置外部 alertmanager 实例" 3.1. 在时间序列和警报中附加额外标签 3.2. 为监控组件设置日志级别 3.3. 为 Prometheus 启用查询日志文件 3.4. 为 Thanos Querier 启用查询日志记录 4. 为 Prometheus Adapter 设置审计日志级别 Expand section "4. 为 Prometheus Adapter 设置审计日志级别" Collapse section "4. 为 Prometheus Adapter 设置审计日志级别" 4.1. 禁用默认的 Grafana 部署 4.2. 禁用本地 Alertmanager 4.3. 后续步骤 5. 为用户定义的项目启用监控 Expand section "5. 为用户定义的项目启用监控" Collapse section "5. 为用户定义的项目启用监控" 5.1. 为用户定义的项目启用监控 5.2. 授予用户权限来监控用户定义的项目 Expand section "5.2. 授予用户权限来监控用户定义的项目" Collapse section "5.2. 授予用户权限来监控用户定义的项目" 5.2.1. 使用 Web 控制台授予用户权限 5.2.2. 使用 CLI 授予用户权限 5.3. 授予用户权限来为用户定义的项目配置监控 5.4. 从集群外部访问自定义应用程序的指标 5.5. 将用户定义的项目从监控中排除 5.6. 为用户定义的项目禁用监控 5.7. 后续步骤 6. 为用户定义的项目启用警报路由 Expand section "6. 为用户定义的项目启用警报路由" Collapse section "6. 为用户定义的项目启用警报路由" 6.1. 了解用户定义的项目的警报路由 6.2. 为用户定义的项目启用警报路由 6.3. 授予用户权限来为用户定义的项目配置警报路由 6.4. 为用户定义的项目禁用警报路由 6.5. 后续步骤 7. 管理指标 Expand section "7. 管理指标" Collapse section "7. 管理指标" 7.1. 了解指标 7.2. 为用户定义的项目设置指标集合 Expand section "7.2. 为用户定义的项目设置指标集合" Collapse section "7.2. 为用户定义的项目设置指标集合" 7.2.1. 部署示例服务 7.2.2. 指定如何监控服务 7.3. 查询指标 Expand section "7.3. 查询指标" Collapse section "7.3. 查询指标" 7.3.1. 以集群管理员身份查询所有项目的指标 7.3.2. 以开发者身份查询用户定义的项目的指标 7.3.3. 探索视觉化指标 7.4. 后续步骤 8. 管理指标目标 Expand section "8. 管理指标目标" Collapse section "8. 管理指标目标" 8.1. 在 Administrator 视角中访问 Metrics Targets 页面 8.2. 搜索和过滤指标目标 8.3. 获取目标的详细信息 8.4. 后续步骤 9. 管理警报 Expand section "9. 管理警报" Collapse section "9. 管理警报" 9.1. 在 Administrator 和 Developer 视角中访问 Alerting UI 9.2. 搜索和过滤警报、静默和警报规则 9.3. 获取关于警报、静默和警报规则的信息 9.4. 管理警报规则 Expand section "9.4. 管理警报规则" Collapse section "9.4. 管理警报规则" 9.4.1. 为用户定义的项目优化警报 9.4.2. 为用户定义的项目创建警报规则 9.4.3. 减少不查询平台指标的警报规则的延迟 9.4.4. 访问用户定义的项目的警报规则 9.4.5. 在单个视图中列出所有项目的警报规则 9.4.6. 为用户定义的项目删除警报规则 9.5. 管理静默 Expand section "9.5. 管理静默" Collapse section "9.5. 管理静默" 9.5.1. 静默警报 9.5.2. 编辑静默 9.5.3. 使静默到期 9.6. 将通知发送到外部系统 Expand section "9.6. 将通知发送到外部系统" Collapse section "9.6. 将通知发送到外部系统" 9.6.1. 配置警报接收器 9.6.2. 为用户定义的项目创建警报路由 9.7. 应用自定义 Alertmanager 配置 9.8. 后续步骤 10. 查看监控仪表板 Expand section "10. 查看监控仪表板" Collapse section "10. 查看监控仪表板" 10.1. 以集群管理员身份查看监控仪表板 10.2. 以开发者身份查看监控仪表板 10.3. 后续步骤 11. 使用 Bare Metal Event Relay 监控裸机事件 Expand section "11. 使用 Bare Metal Event Relay 监控裸机事件" Collapse section "11. 使用 Bare Metal Event Relay 监控裸机事件" 11.1. 关于裸机事件 11.2. 裸机事件的工作方式 Expand section "11.2. 裸机事件的工作方式" Collapse section "11.2. 裸机事件的工作方式" 11.2.1. 裸机事件中继数据流 Expand section "11.2.1. 裸机事件中继数据流" Collapse section "11.2.1. 裸机事件中继数据流" 11.2.1.1. Operator 管理的 pod 11.2.1.2. 裸机事件中继 11.2.1.3. 云原生事件 11.2.1.4. CNCF CloudEvents 11.2.1.5. AMQP 分配路由器 11.2.1.6. 云事件代理 sidecar 11.2.2. Redfish 消息解析服务 11.2.3. 使用 CLI 安装裸机事件中继 11.2.4. 使用 Web 控制台安装 Bare Metal Event Relay 11.3. 安装 AMQ 消息传递总线 11.4. 订阅集群节点的 Redfish BMC 裸机事件 Expand section "11.4. 订阅集群节点的 Redfish BMC 裸机事件" Collapse section "11.4. 订阅集群节点的 Redfish BMC 裸机事件" 11.4.1. 订阅裸机事件 11.4.2. 使用 curl 查询 Redfish 裸机事件订阅 11.4.3. 创建裸机事件和 Secret CR 11.5. 将应用程序订阅到裸机事件 REST API 参考 12. 访问第三方监控 UI 和 API Expand section "12. 访问第三方监控 UI 和 API" Collapse section "12. 访问第三方监控 UI 和 API" 12.1. 访问第三方监控 UI 12.2. 访问第三方监控 Web 服务 API 12.3. 使用 Prometheus 的联邦端点查询指标 12.4. 其他资源 13. 监控问题的故障排除 Expand section "13. 监控问题的故障排除" Collapse section "13. 监控问题的故障排除" 13.1. 检查为什么用户定义的指标不可用 13.2. 确定为什么 Prometheus 消耗大量磁盘空间 14. Cluster Monitoring Operator 的 ConfigMap 参考 Expand section "14. Cluster Monitoring Operator 的 ConfigMap 参考" Collapse section "14. Cluster Monitoring Operator 的 ConfigMap 参考" 14.1. Cluster Monitoring 配置参考 14.2. AdditionalAlertmanagerConfig Expand section "14.2. AdditionalAlertmanagerConfig" Collapse section "14.2. AdditionalAlertmanagerConfig" 14.2.1. 描述 14.2.2. 必需 14.3. AlertmanagerMainConfig Expand section "14.3. AlertmanagerMainConfig" Collapse section "14.3. AlertmanagerMainConfig" 14.3.1. 描述 14.4. ClusterMonitoringConfiguration Expand section "14.4. ClusterMonitoringConfiguration" Collapse section "14.4. ClusterMonitoringConfiguration" 14.4.1. 描述 14.5. K8sPrometheusAdapter Expand section "14.5. K8sPrometheusAdapter" Collapse section "14.5. K8sPrometheusAdapter" 14.5.1. 描述 14.6. KubeStateMetricsConfig Expand section "14.6. KubeStateMetricsConfig" Collapse section "14.6. KubeStateMetricsConfig" 14.6.1. 描述 14.7. OpenShiftStateMetricsConfig Expand section "14.7. OpenShiftStateMetricsConfig" Collapse section "14.7. OpenShiftStateMetricsConfig" 14.7.1. 描述 14.8. PrometheusK8sConfig Expand section "14.8. PrometheusK8sConfig" Collapse section "14.8. PrometheusK8sConfig" 14.8.1. 描述 14.9. PrometheusOperatorConfig Expand section "14.9. PrometheusOperatorConfig" Collapse section "14.9. PrometheusOperatorConfig" 14.9.1. 描述 14.10. PrometheusRestrictedConfig Expand section "14.10. PrometheusRestrictedConfig" Collapse section "14.10. PrometheusRestrictedConfig" 14.10.1. 描述 14.11. RemoteWriteSpec Expand section "14.11. RemoteWriteSpec" Collapse section "14.11. RemoteWriteSpec" 14.11.1. 描述 14.11.2. 必需 14.12. TLSConfig Expand section "14.12. TLSConfig" Collapse section "14.12. TLSConfig" 14.12.1. 描述 14.12.2. 必需 14.13. ThanosQuerierConfig Expand section "14.13. ThanosQuerierConfig" Collapse section "14.13. ThanosQuerierConfig" 14.13.1. 描述 14.14. ThanosRulerConfig Expand section "14.14. ThanosRulerConfig" Collapse section "14.14. ThanosRulerConfig" 14.14.1. 描述 14.15. UserWorkloadConfiguration Expand section "14.15. UserWorkloadConfiguration" Collapse section "14.15. UserWorkloadConfiguration" 14.15.1. 描述 法律通告 Settings Close Language: 简体中文 한국어 日本語 English Language: 简体中文 한국어 日本語 English Format: Multi-page Single-page Format: Multi-page Single-page Language and Page Formatting Options Language: 简体中文 한국어 日本語 English Language: 简体中文 한국어 日本語 English Format: Multi-page Single-page Format: Multi-page Single-page 监控 OpenShift Container Platform 4.10在 OpenShift Container Platform 中配置和使用监控堆栈 Red Hat OpenShift Documentation Team法律通告摘要 本文提供有关在 OpenShift Container Platform 中配置和使用 Prometheus 监控堆栈的说明。 Next