16.9.5. 由 vSphere Problem Detector Operator 运行的配置检查

下表标识了配置检查是否运行 vSphere Problem Detector Operator。有些检查会验证集群的配置。其他检查验证集群中每个节点的配置。

表 16.58. 集群配置检查

名称描述

CheckDefaultDatastore

验证 vSphere 配置中的默认数据存储名称是否足够短,可用于动态置备。

如果这个检查失败,您可以预期如下情况:

  • systemd 将错误记录到日志中,如 Failed to set up mount unit: Invalid argument
  • 如果在虚拟机没有从节点排空所有 pod 的情况下关闭或重新引导虚拟机,systemd 不会卸载卷。

如果检查失败,请重新配置 vSphere,使用较短名称用于默认数据存储。

CheckFolderPermissions

验证列出默认数据存储中卷的权限。创建卷时需要此权限。Operator 通过列出 //kubevols 目录来验证权限。根目录必须存在。可以接受在检查运行时不存在 /kubevols 目录的情况。如果不存在,当数据存储用于动态置备时 /kubevols 目录会被创建。

如果检查失败,请查看 OpenShift Container Platform 安装过程中指定的 vCenter 帐户所需的权限。

CheckStorageClasses

验证以下内容:

  • 这个存储类置备的每个持久性卷的完全限定路径小于 255 个字符。
  • 如果存储类使用存储策略,存储类必须只使用一个策略,且必须定义该策略。

CheckTaskPermissions

验证列出最新任务和数据存储的权限。

ClusterInfo

从 vSphere vCenter 收集集群版本和 UUID。

表 16.59. 节点配置检查

名称描述

CheckNodeDiskUUID

验证所有 vSphere 虚拟机是否已配置为 disk.enableUUID=TRUE

如果这个检查失败,请参阅如何在 vSphere Red Hat Knowledgebase 解决方案中检查 VM 的 'disk.EnableUUID' 参数

CheckNodeProviderID

验证所有节点是否都配置了来自 vSphere vCenter 的 ProviderID。当以下命令的输出不包括每个节点的供应商 ID 时,进行检查会失败。

$ oc get nodes -o custom-columns=NAME:.metadata.name,PROVIDER_ID:.spec.providerID,UUID:.status.nodeInfo.systemUUID

如果这个检查失败,请参阅 vSphere 产品文档来获取集群中每个节点的供应商 ID 的信息。

CollectNodeESXiVersion

报告运行节点的 ESXi 主机的版本。

CollectNodeHWVersion

报告节点的虚拟机硬件版本。