第 14 章 支持

14.1. 支持概述

您可以收集有关环境的数据,监控集群和虚拟机 (VM) 的健康状态,并使用以下工具对 OpenShift Virtualization 资源进行故障排除。

14.1.1. Web 控制台

OpenShift Container Platform Web 控制台显示集群和 OpenShift Virtualization 组件和资源的资源使用、警报、事件和趋势。

表 14.1. 用于监控和故障排除的 Web 控制台页面

页面描述

概述页面

集群详情、状态、警报、清单和资源使用情况

VirtualizationOverview 标签页

OpenShift Virtualization 资源、使用量、警报和状态

VirtualizationTop consumers 标签页

CPU、内存和存储的主要使用者

VirtualizationMigrations 标签页

实时迁移的进度

VirtualMachinesVirtualMachineVirtualMachine detailsMetrics 标签页

VM 资源使用情况、存储、网络和迁移

VirtualMachinesVirtualMachineVirtualMachine detailsEvents 标签页

VM 事件列表

VirtualMachinesVirtualMachineVirtualMachine details诊断标签页

虚拟机状态条件和卷快照状态

14.1.2. 为红帽支持收集数据

当您向红帽支持提交支持问题单时,提供调试信息会很有帮助。您可以执行以下步骤来收集调试信息:

收集有关环境的数据
配置 Prometheus 和 Alertmanager,并为 OpenShift Container Platform 和 OpenShift Virtualization 收集 must-gather 数据。
收集虚拟机的数据
从虚拟机收集 must-gather 数据和内存转储。
OpenShift Virtualization 的 must-gather 工具
配置和使用 must-gather 工具。

14.1.3. 监控

您可以监控集群和虚拟机的健康状况。有关监控工具的详情,请查看监控概述

14.1.4. 故障排除

对 OpenShift Virtualization 组件和虚拟机进行故障排除,并解决在 web 控制台中触发警报的问题。

事件
查看虚拟机、命名空间和资源的重要生命周期信息。
日志
查看并配置 OpenShift Virtualization 组件和虚拟机的日志。
Runbooks
在 web 控制台中诊断并解决触发 OpenShift Virtualization 警报的问题。
数据卷故障排除
通过分析条件和事件来排除数据卷的问题。