Skip to navigation Skip to main content

Utilities

  • Subscriptions
  • Downloads
  • Containers
  • Support Cases
Red Hat Customer Portal
  • Subscriptions
  • Downloads
  • Containers
  • Support Cases
  • Products & Services

    Products

    Support

    • Production Support
    • Development Support
    • Product Life Cycles

    Services

    • Consulting
    • Technical Account Management
    • Training & Certifications

    Documentation

    • Red Hat Enterprise Linux
    • Red Hat JBoss Enterprise Application Platform
    • Red Hat OpenStack Platform
    • Red Hat OpenShift Container Platform
    All Documentation

    Ecosystem Catalog

    • Red Hat Partner Ecosystem
    • Partner Resources
  • Tools

    Tools

    • Troubleshoot a product issue
    • Packages
    • Errata

    Customer Portal Labs

    • Configuration
    • Deployment
    • Security
    • Troubleshoot
    All labs

    Red Hat Insights

    Increase visibility into IT operations to detect and resolve technical issues before they impact your business.

    Learn More
    Go to Insights
  • Security

    Red Hat Product Security Center

    Engage with our Red Hat Product Security team, access security updates, and ensure your environments are not exposed to any known security vulnerabilities.

    Product Security Center

    Security Updates

    • Security Advisories
    • Red Hat CVE Database
    • Security Labs

    Keep your systems secure with Red Hat's specialized responses to security vulnerabilities.

    View Responses

    Resources

    • Security Blog
    • Security Measurement
    • Severity Ratings
    • Backporting Policies
    • Product Signing (GPG) Keys
  • Community

    Customer Portal Community

    • Discussions
    • Private Groups
    Community Activity

    Customer Events

    • Red Hat Convergence
    • Red Hat Summit

    Stories

    • Red Hat Subscription Value
    • You Asked. We Acted.
    • Open Source Communities
Or troubleshoot an issue.

Select Your Language

  • English
  • 한국어
  • 日本語
  • 中文 (中国)

Infrastructure and Management

  • Red Hat Enterprise Linux
  • Red Hat Virtualization
  • Red Hat Identity Management
  • Red Hat Directory Server
  • Red Hat Certificate System
  • Red Hat Satellite
  • Red Hat Subscription Management
  • Red Hat Update Infrastructure
  • Red Hat Insights
  • Red Hat Ansible Automation Platform

Cloud Computing

  • Red Hat OpenShift
  • Red Hat CloudForms
  • Red Hat OpenStack Platform
  • Red Hat OpenShift Container Platform
  • Red Hat OpenShift Data Science
  • Red Hat OpenShift Online
  • Red Hat OpenShift Dedicated
  • Red Hat Advanced Cluster Security for Kubernetes
  • Red Hat Advanced Cluster Management for Kubernetes
  • Red Hat Quay
  • OpenShift Dev Spaces
  • Red Hat OpenShift Service on AWS

Storage

  • Red Hat Gluster Storage
  • Red Hat Hyperconverged Infrastructure
  • Red Hat Ceph Storage
  • Red Hat OpenShift Data Foundation

Runtimes

  • Red Hat Runtimes
  • Red Hat JBoss Enterprise Application Platform
  • Red Hat Data Grid
  • Red Hat JBoss Web Server
  • Red Hat Single Sign On
  • Red Hat support for Spring Boot
  • Red Hat build of Node.js
  • Red Hat build of Thorntail
  • Red Hat build of Eclipse Vert.x
  • Red Hat build of OpenJDK
  • Red Hat build of Quarkus

Integration and Automation

  • Red Hat Integration
  • Red Hat Fuse
  • Red Hat AMQ
  • Red Hat 3scale API Management
  • Red Hat JBoss Data Virtualization
  • Red Hat Process Automation
  • Red Hat Process Automation Manager
  • Red Hat Decision Manager
All Products

Table of contents

  1. 监控
  2. 1. 监控概述
    1. 1.1. 关于 OpenShift Container Platform 监控
    2. 1.2. 了解监控堆栈
      1. 1.2.1. 默认监控组件
      2. 1.2.2. 默认监控目标
      3. 1.2.3. 用于监控用户定义的项目的组件
      4. 1.2.4. 用户定义的项目的监控目标
    3. 1.3. OpenShift Container Platform 监控的常见术语表
    4. 1.4. 其他资源
    5. 1.5. 后续步骤
  3. 2. 配置监控堆栈
    1. 2.1. 先决条件
    2. 2.2. 对监控的维护和支持
      1. 2.2.1. 对监控的支持注意事项
      2. 2.2.2. 监控 Operator 的支持策略
    3. 2.3. 准备配置监控堆栈
      1. 2.3.1. 创建集群监控配置映射
      2. 2.3.2. 创建用户定义的工作负载监控配置映射
    4. 2.4. 配置监控堆栈
    5. 2.5. 可配置的监控组件
    6. 2.6. 使用节点选择器移动监控组件
      1. 2.6.1. 节点选择器与其他约束一起使用
      2. 2.6.2. 将监控组件移到其他节点
    7. 2.7. 为监控组件分配容忍(tolerations)
    8. 2.8. 为指标提取设置正文大小限制
    9. 2.9. 配置持久性存储
      1. 2.9.1. 持久性存储的先决条件
      2. 2.9.2. 配置本地持久性卷声明
      3. 2.9.3. 重新定义持久性存储卷的大小
      4. 2.9.4. 修改 Prometheus 指标数据的保留时间和大小
      5. 2.9.5. 修改 Thanos Ruler 指标数据的保留时间
    10. 2.10. 配置远程写入存储
      1. 2.10.1. 支持的远程写入身份验证设置
        1. 2.10.1.1. 身份验证设置的配置映射位置
        2. 2.10.1.2. 远程写入身份验证设置示例
    11. 2.11. 在指标中添加集群 ID 标签
      1. 2.11.1. 为指标创建集群 ID 标签
    12. 2.12. 控制用户定义的项目中未绑定指标属性的影响
      1. 2.12.1. 为用户定义的项目设置提取示例和标签限制
      2. 2.12.2. 创建提取示例警报
  4. 3. 配置外部 alertmanager 实例
    1. 3.1. 在时间序列和警报中附加额外标签
  5. 4. 为监控配置 pod 拓扑分布限制
    1. 4.1. 为 Prometheus 设置 pod 拓扑分布限制
    2. 4.2. 为 Alertmanager 设置 pod 拓扑分布限制
    3. 4.3. 为 Thanos Ruler 设置 pod 拓扑分布限制
    4. 4.4. 为监控组件设置日志级别
    5. 4.5. 为 Prometheus 启用查询日志文件
    6. 4.6. 为 Thanos Querier 启用查询日志记录
  6. 5. 为 Prometheus Adapter 设置审计日志级别
    1. 5.1. 禁用本地 Alertmanager
    2. 5.2. 后续步骤
  7. 6. 为用户定义的项目启用监控
    1. 6.1. 为用户定义的项目启用监控
    2. 6.2. 授予用户权限来监控用户定义的项目
      1. 6.2.1. 使用 Web 控制台授予用户权限
      2. 6.2.2. 使用 CLI 授予用户权限
    3. 6.3. 授予用户权限来为用户定义的项目配置监控
    4. 6.4. 从集群外部访问自定义应用程序的指标
    5. 6.5. 将用户定义的项目从监控中排除
    6. 6.6. 为用户定义的项目禁用监控
    7. 6.7. 后续步骤
  8. 7. 为用户定义的项目启用警报路由
    1. 7.1. 了解用户定义的项目的警报路由
    2. 7.2. 为用户定义的警报路由启用平台 Alertmanager 实例
    3. 7.3. 为用户定义的警报路由启用一个单独的 Alertmanager 实例
    4. 7.4. 授予用户权限来为用户定义的项目配置警报路由
    5. 7.5. 后续步骤
  9. 8. 管理指标
    1. 8.1. 了解指标
    2. 8.2. 为用户定义的项目设置指标集合
      1. 8.2.1. 部署示例服务
      2. 8.2.2. 指定如何监控服务
    3. 8.3. 查看可用指标列表
    4. 8.4. 后续步骤
  10. 9. 查询指标
    1. 9.1. 关于查询指标
      1. 9.1.1. 以集群管理员身份查询所有项目的指标
      2. 9.1.2. 以开发者身份查询用户定义的项目的指标
      3. 9.1.3. 探索视觉化指标
    2. 9.2. 后续步骤
  11. 10. 管理指标目标
    1. 10.1. 在 Administrator 视角中访问 Metrics Targets 页面
    2. 10.2. 搜索和过滤指标目标
    3. 10.3. 获取目标的详细信息
    4. 10.4. 后续步骤
  12. 11. 管理警报
    1. 11.1. 在 Administrator 和 Developer 视角中访问 Alerting UI
    2. 11.2. 搜索和过滤警报、静默和警报规则
    3. 11.3. 获取关于警报、静默和警报规则的信息
    4. 11.4. 管理静默
      1. 11.4.1. 静默警报
      2. 11.4.2. 编辑静默
      3. 11.4.3. 使静默到期
    5. 11.5. 为用户定义的项目管理警报规则
      1. 11.5.1. 为用户定义的项目优化警报
      2. 11.5.2. 为用户定义的项目创建警报规则
      3. 11.5.3. 减少不查询平台指标的警报规则的延迟
      4. 11.5.4. 访问用户定义的项目的警报规则
      5. 11.5.5. 在单个视图中列出所有项目的警报规则
      6. 11.5.6. 为用户定义的项目删除警报规则
    6. 11.6. 管理用于核心平台监控的警报规则
      1. 11.6.1. 修改核心平台警报规则
      2. 11.6.2. 创建新警报规则
    7. 11.7. 将通知发送到外部系统
      1. 11.7.1. 配置警报接收器
      2. 11.7.2. 为用户定义的项目创建警报路由
    8. 11.8. 应用自定义 Alertmanager 配置
    9. 11.9. 将自定义配置应用到 Alertmanager 以进行用户定义的警报路由
    10. 11.10. 后续步骤
  13. 12. 查看监控仪表板
    1. 12.1. 以集群管理员身份查看监控仪表板
    2. 12.2. 以开发者身份查看监控仪表板
    3. 12.3. 后续步骤
  14. 13. NVIDIA GPU 管理仪表板
    1. 13.1. 简介
    2. 13.2. 安装 NVIDIA GPU 管理仪表板
    3. 13.3. 使用 NVIDIA GPU 管理仪表板
      1. 13.3.1. 查看集群 GPU 概述
      2. 13.3.2. 查看 GPU 仪表板
      3. 13.3.3. 查看 GPU 指标
  15. 14. 使用 Bare Metal Event Relay 监控裸机事件
    1. 14.1. 关于裸机事件
    2. 14.2. 裸机事件的工作方式
      1. 14.2.1. 裸机事件中继数据流
        1. 14.2.1.1. Operator 管理的 pod
        2. 14.2.1.2. 裸机事件中继
        3. 14.2.1.3. 云原生事件
        4. 14.2.1.4. CNCF CloudEvents
        5. 14.2.1.5. AMQP 分配路由器
        6. 14.2.1.6. 云事件代理 sidecar
      2. 14.2.2. Redfish 消息解析服务
      3. 14.2.3. 使用 CLI 安装裸机事件中继
      4. 14.2.4. 使用 Web 控制台安装 Bare Metal Event Relay
    3. 14.3. 安装 AMQ 消息传递总线
    4. 14.4. 订阅集群节点的 Redfish BMC 裸机事件
      1. 14.4.1. 订阅裸机事件
      2. 14.4.2. 使用 curl 查询 Redfish 裸机事件订阅
      3. 14.4.3. 创建裸机事件和 Secret CR
    5. 14.5. 将应用程序订阅到裸机事件 REST API 参考
  16. 15. 访问第三方的监控 API
    1. 15.1. 访问第三方监控 Web 服务 API
    2. 15.2. 使用 Prometheus 的联邦端点查询指标
    3. 15.3. 其他资源
  17. 16. 监控问题的故障排除
    1. 16.1. 检查为什么用户定义的指标不可用
    2. 16.2. 确定为什么 Prometheus 消耗大量磁盘空间
  18. 17. Cluster Monitoring Operator 的配置映射引用
    1. 17.1. Cluster Monitoring Operator 配置参考
    2. 17.2. AdditionalAlertmanagerConfig
      1. 17.2.1. Description
      2. 17.2.2. 必需
    3. 17.3. AlertmanagerMainConfig
      1. 17.3.1. Description
    4. 17.4. AlertmanagerUserWorkloadConfig
      1. 17.4.1. Description
    5. 17.5. ClusterMonitoringConfiguration
      1. 17.5.1. Description
    6. 17.6. DedicatedServiceMonitors
      1. 17.6.1. Description
    7. 17.7. K8sPrometheusAdapter
      1. 17.7.1. Description
    8. 17.8. KubeStateMetricsConfig
      1. 17.8.1. Description
    9. 17.9. OpenShiftStateMetricsConfig
      1. 17.9.1. Description
    10. 17.10. PrometheusK8sConfig
      1. 17.10.1. Description
    11. 17.11. PrometheusOperatorConfig
      1. 17.11.1. Description
    12. 17.12. PrometheusRestrictedConfig
      1. 17.12.1. Description
    13. 17.13. RemoteWriteSpec
      1. 17.13.1. Description
      2. 17.13.2. 必需
    14. 17.14. TelemeterClientConfig
      1. 17.14.1. Description
      2. 17.14.2. 必需
    15. 17.15. ThanosQuerierConfig
      1. 17.15.1. Description
    16. 17.16. ThanosRulerConfig
      1. 17.16.1. Description
    17. 17.17. TLSConfig
      1. 17.17.1. Description
      2. 17.17.2. 必需
    18. 17.18. UserWorkloadConfiguration
      1. 17.18.1. Description
  19. 法律通告

7.5. 后续步骤

  • 管理警报
  1. Previous
  2. Next
Red Hat

Quick Links

  • Downloads
  • Subscriptions
  • Support Cases
  • Customer Service
  • Product Documentation

Help

  • Contact Us
  • Customer Portal FAQ
  • Log-in Assistance

Site Info

  • Trust Red Hat
  • Browser Support Policy
  • Accessibility
  • Awards and Recognition
  • Colophon

Related Sites

  • redhat.com
  • developers.redhat.com
  • connect.redhat.com
  • cloud.redhat.com

About

  • Red Hat Subscription Value
  • About Red Hat
  • Red Hat Jobs
Copyright © 2023 Red Hat, Inc.
  • Privacy Statement
  • Customer Portal Terms of Use
  • All Policies and Guidelines
Red Hat Summit
Twitter