5.2. 将监控配置为使用 OpenShift Container Storage
OpenShift Container Storage 提供了一个监控堆栈,其中包含 Prometheus 和 Alert Manager。
按照本节中的说明,将 OpenShift Container Storage 配置为监控堆栈的存储。
如果存储空间不足,则监控将无法正常工作。始终确保您拥有大量用于监控的存储容量。
红帽建议为此服务配置简短的保留间隔。详情请参阅 OpenShift Container Platform 文档中的 Prometheus 指标指南的修改保留时间。
先决条件
- 具有 OpenShift Web 控制台的管理访问权限。
-
OpenShift Container Storage Operator 已安装并在
openshift-storage命名空间中运行。在 OpenShift Web 控制台中,点 Operators → Installed Operators 查看已安装的 Operator。 -
监控 Operator 在
openshift-monitoring命名空间内安装并运行。在 OpenShift Web 控制台中,点 Administration → Cluster Settings → Cluster Operators 查看集群操作器。 -
带有 provisioner
openshift-storage.rbd.csi.ceph.com的存储类可用。在 OpenShift Web 控制台中,点 Storage → Storage Classes 查看可用的存储类。
步骤
- 在 OpenShift Web 控制台中,前往 Workloads → Config Maps。
-
将 Project 下拉菜单设置为
openshift-monitoring。 - 单击 Create Config Map。
使用以下命令定义一个新的
cluster-monitoring-configConfig Map:将尖括号 (
<,>) 中的内容替换为您自己的值,如retention: 24h或storage: 40Gi。将 storageClassName 替换为使用 provisioner
openshift-storage.rbd.csi.ceph.com的storageclass。在下例中,storageclass 的名称为ocs-storagecluster-ceph-rbd。cluster-monitoring-configConfig Map 示例apiVersion: v1 kind: ConfigMap metadata: name: cluster-monitoring-config namespace: openshift-monitoring data: config.yaml: | prometheusK8s: retention: <time to retain monitoring files, e.g. 24h> volumeClaimTemplate: metadata: name: ocs-prometheus-claim spec: storageClassName: ocs-storagecluster-ceph-rbd resources: requests: storage: <size of claim, e.g. 40Gi> alertmanagerMain: volumeClaimTemplate: metadata: name: ocs-alertmanager-claim spec: storageClassName: ocs-storagecluster-ceph-rbd resources: requests: storage: <size of claim, e.g. 40Gi>- 单击 Create 以保存并创建 Config Map。
验证步骤
验证持久卷声明是否已绑定到 pod。
- 进入 Storage → Persistent Volume Claims。
-
将 Project 下拉菜单设置为
openshift-monitoring。 验证 5 持久性卷声明是否可见,状态为
Bound,附加到三个alertmanager-main-*pod,以及两个prometheus-k8s-*pod。监控创建和绑定的存储
验证新
alertmanager-main-*pod 的状态是否显示为Running。- 进入 Workloads → Pods。
-
点击新
alertmanager-main-*pod 查看 pod 详情。 向下滚动到 Volumes,再验证卷是否具有 Type (
ocs-alertmanager-claim),它与您的新持久性卷声明匹配,如ocs-alertmanager-claim-alertmanager-main-0。附加到
alertmanager-main-*pod 的持久性卷声明
验证新的
prometheus-k8s-*pod 的状态是否为Running。-
点新的
prometheus-k8s-*Pod 查看 pod 详情。 向下滚动到 Volumes,再验证卷是否具有 Type (
ocs-prometheus-claim),它与您的新持久性卷声明匹配,如ocs-prometheus-claim-prometheus-k8s-0。附加到
prometheus-k8s-*pod 的持久性卷声明
-
点新的