1.3. 管理集群警报

OpenShift Container Platform 4.5 为 Alertmanager 提供了一个 web 界面,供您用于管理警报。本节演示如何使用 Alerting UI。

重要

目前,Alerting UI 仅显示 OpenShift Container Platform 中默认出现的警报。它不会列出用户定义的警报。这会在以后的发行版本中改变。

注意

Alerting UI 只能通过管理员视角访问,而不能通过开发者视角访问。

1.3.1. Alerting UI 的内容

本节演示并说明 Alerting UI 的内容,该 UI 是 Alertmanager 的 Web 界面。

在 OpenShift Container Platform web 控制台中,点 MonitoringAlerting 来访问 Alerting UI。

Alerting UI 有三个主要页面,即 AlertsSilencesAlerting rules 页面。

Alerts 页:

监控警报画面
  1. 按名称过滤警报。
  2. 按状态过滤警报。若要触发警报,某些警报需要在超时时间内持续满足特定条件。如果警报的某一条件当前为真,但其超时时间尚未结束,那么这个警报处于 Pending 状态。
  3. 警报的名称。
  4. 警报的描述。
  5. 警报的严重性标签值。
  6. 警报的当前状态,以及该警报进入此状态的时间。
  7. 您可以对警报执行的操作。

Silences 页:

监控静默页面
  1. 为警报创建静默。
  2. 按名字过滤静默。
  3. 按状态过滤静默。如果静默为待处理状态,这表示其当前不活跃,因为它已调度到以后的某一时间启动。如果静默已到期,这表示它不再活跃,因为已经达到其结束时间。
  4. 静默的描述。它包括匹配的静默(silence)名和警报规格。
  5. 被静默时设置为静默的警报数。
  6. 静默的当前状态。对于活跃的静默,它会显示静默何时结束。对于待处理的静默,它会显示静默何时启动。
  7. 创建静默的用户。
  8. 您可以对静默执行的操作。

Alerting Rules 页:

监控警报规则界面
  1. 按名称过滤 Alerting Rules。
  2. 按状态过滤 Alerting Rules。
  3. 警报规则名称。
  4. Alerting Rule 的 Severity 标签的值。
  5. Alerting Rule 定义的 Alert 状态。

另外,每个页面的标题旁边还有一个 Alertmanager 界面链接。

1.3.2. 获取关于警报和警报规则的信息

您可以查找警报,并查看有关这个警报或相关警报规则的信息。

流程

  1. 打开 OpenShift Container Platform Web 控制台,并浏览至 MonitoringAlertingAlerts 页面。
  2. 可选:使用 Filter Alerts by name 字段来按照名称过滤警报。
  3. 可选:使用 FiringSilencedPending 状态按钮中的一个或多个按钮来根据状态过滤警报。
  4. 可选:点击 NameStateSeverity 列标题中的一个或多个标题对警报进行排序。
  5. 在看到所需警报后,您可以查看该警报的详情或相关警报规则的详情。

    要查看警报详情,请点击警报的名称。打开的页面包含注明警报时序的图形。还有与此警报相关的信息,包括:

    • 其相关警报规则的链接
    • 警报的描述
    • 附加到警报的标签

    要查看警报规则详情,请点击最后一列中的按钮并选择 View Alerting Rule。该页包含与警报规则相关的信息,包括:

    • 警报规则名称、严重性和描述
    • 定义触发此警报的条件的表达式
    • 触发警报的条件得到满足的时间
    • 受警报规则约束的各个警报的图形,其中显示了触发该警报的值
    • 受警报规则约束的所有警报的列表

1.3.3. 静默警报

您可以静默特定的警报,或者静默符合您定义的指定条件的警报。

流程

通过创建警报指定条件来静默一组警报:

  1. 浏览到 OpenShift Container Platform Web 控制台的 MonitoringAlertingSilences 页面。
  2. 点击 Create Silence
  3. 填充 Create Silence 表单。
  4. 若要创建静默,请点击 Silence

静默特定的警报:

  1. 浏览到 OpenShift Container Platform Web 控制台的 MonitoringAlertingAlerts 页面。
  2. 针对您想要静默的警报,点击最后一列中的按钮,然后点击 Silence Alert。这时会显示 Create Silence 表单,其中预先填充了所选警报的指定条件。
  3. 可选:修改静默。
  4. 若要创建静默,请点击 Silence

1.3.4. 获取有关静默的信息

您可以查找静默并查看其详情。

流程

  1. 打开 OpenShift Container Platform Web 控制台,并浏览至 MonitoringAlertingSilences 页面。
  2. 可选:使用 Filter Silences by name 字段来按照名称过滤静默。
  3. 可选:使用 ActivePendingExpired 状态按钮中的一个或多个按钮,以按状态过滤静默。
  4. 可选:点一个或多个 NameFiring AlertsStateCreator 栏上面的标头来对静默进行排序。
  5. 看到所需静默后,您可以点击其名称查看详情,其中包括:

    • 警报指定条件
    • 状态
    • 开始时间
    • 结束时间
    • 触发警报的数目和列表

1.3.5. 编辑静默

您可以编辑静默,这样会导致现有静默到期,并以更改后的配置创建新静默。

流程

  1. 浏览到 MonitoringAlertingSilences 页面。
  2. 针对您想要修改的静默,点击最后一列中的按钮,然后点击 Edit silence

    或者,也可以点击特定静默的 Silence Overview 页中的 ActionsEdit Silence

  3. Edit Silence 页中,输入您的更改,再点击 Save 按钮。这会使现有的静默到期,并以所选配置创建新静默。

1.3.6. 使静默到期

您可以让静默到期。让静默到期会永久停用这一静默。

流程

  1. 浏览到 MonitoringAlertingSilences 页面。
  2. 针对您想要令其到期的静默,点击最后一列中的按钮,然后点击 Expire Silence

    或者,也可以点击特定静默的 Silence Overview 页面中的 ActionsExpire Silence 按钮。

  3. 点击 Expire Silence 进行确认。这会使静默到期。

1.3.7. 更改 Alertmanager 配置

您可以使用 OpenShift Container Platform web 控制台编辑 YAML 配置文件,从而更改 Alertmanager 配置。

流程

要更改 Alertmanager 配置:

  1. 进入 web 控制台的 AdministrationCluster SettingsGlobal ConfigurationAlertmanagerYAML 页面。
  2. 修改 YAML 配置文件。
  3. Save

其他资源

1.3.8. 后续步骤

检查集群指标。