1.4. 检查集群指标

OpenShift Container Platform 4.3 为 Prometheus 提供了一个 Web 界面,可供您运行 Prometheus Query Language (PromQL) 查询并查看图表中呈现的指标。此功能提供集群状态的综合概览,并可供您用于排查问题。

1.4.1. Metrics UI 的内容

本节演示并说明 Metrics UI 的内容,该 UI 是 Prometheus 的 Web 界面。

若要访问 Metrics 页面,可在 OpenShift Container Platform Web 控制台中点击 MonitoringMetrics

监控指标画面
  1. 操作。

    • 添加查询。
    • 展开或折叠所有查询表。
    • 删除所有查询。
  2. 隐藏图表。
  3. 交互式图表。
  4. 可用指标的目录。
  5. 添加查询。
  6. 运行查询。
  7. 查询表单。
  8. 展开或折叠表单。
  9. 查询。
  10. 清除查询。
  11. 启用或禁用查询。
  12. 特定查询的操作。

    • 启用或禁用查询。
    • 在图表中显示或隐藏查询的所有系列。
    • 删除查询。
  13. 查询的指标表。
  14. 分配给指标图形的颜色。点击方块可以显示或隐藏指标图形。

另外,页面标题旁边也提供 Prometheus 旧界面的链接。

1.4.2. 运行指标查询

您可以通过输入一个或多个 Prometheus Query Language (PromQL) 查询来开始使用指标。

流程

  1. 打开 OpenShift Container Platform Web 控制台,并浏览至 MonitoringMetrics 页面。
  2. 在查询字段中,输入您的 PromQL 查询。

    • 要显示所有可用的指标和 PromQL 函数,请点击 Insert Metric at Cursor
  3. 如需多个查询,请点击 Add Query
  4. 若要删除查询,请点击查询的 kebab ,然后选择 Delete query
  5. 若要保留查询但不运行查询,请点击 Disable query 按钮。
  6. 完成创建查询后,点击 Run Queries 按钮。图表中会直观呈现查询的指标。如果查询无效,则 UI 会显示错误消息。

    注意

    如果查询对大量数据进行运算,这可能会在绘制时序图时造成浏览器超时或过载。要避免这种情况,请隐藏图形并且仅使用指标表来校准查询。然后,在找到可行的查询后,启用图表来绘制图形。

  7. 可选:页面 URL 现在包含您运行的查询。要在以后再次使用这一组查询,请保存这个 URL。

其他资源

参阅 Prometheus Query Language 文档

1.4.3. 探索视觉化指标

运行查询后,指标会显示在交互式图表中。图表的 X 轴代表时间。Y 轴代表指标值。每个指标都以带颜色的图形显示。您可以操作图表并探索指标。

流程

  1. 最初,图表中显示所有启用的查询中的所有指标。您可以要选择显示哪些指标。

    • 要隐藏查询的所有指标,请点击查询的 kebab ,然后点击 Hide all series
    • 要隐藏特定的指标,请转至查询表,然后点击指标名称旁边带颜色的方块。
  2. 要放大图表并更改显示的时间范围,请执行以下操作之一:

    • 点击图表并在水平方向上拖动,以可视化方式选择时间范围。
    • 使用左上角的菜单来选择时间范围。

    要重置时间范围,请点击 Reset Zoom

  3. 要显示所有查询在特定时间点的输出,请将鼠标光标停留在图表中的对应点上。弹出框中会显示查询输出。
  4. 如需有关特定查询的指标的详细信息,请使用下拉按钮展开该查询的表。每个指标均显示其当前的值。
  5. 要隐藏图表,请点击 Hide Graph

1.4.4. 非管理员对指标的访问

作为开发者,您可以为项目中的应用程序或服务启用用户工作负载监控。作为管理员,您可以使用相同的功能来启用对基础架构工作负载的监控。在这种情况下,该项目的开发者或管理员可以使用 Web 控制台中的开发者视角来检查公开的指标。

重要

使用开发者视角检查指标只是一项技术预览功能。技术预览功能不被红帽产品服务等级协议 (SLA) 支持,且可能在功能方面有缺陷。红帽不推荐在生产环境中使用它们。这些技术预览功能可以使用户提早试用新的功能,并有机会在开发阶段提供反馈意见。

有关红帽技术预览功能支持范围的详情,请参阅 https://access.redhat.com/support/offerings/techpreview/

其他资源

请参阅有关监控您自己的服务的文档。它包括以开发者或特权用户身份访问非集群指标的详情。

1.4.5. 后续步骤

访问 Prometheus、Alertmanager 和 Grafana。


为了尽快向用户提供最新的信息,本文档可能会包括由机器自动从英文原文翻译的内容。如需更多信息,请参阅此说明。