故障排除 OpenShift 容器平台 4.x: Operator Lifecycle Manager (OLM)

已更新 -

获取信息

除了下面的信息外,获取 must-gather 文件是一个好方法 standard OpenShift Must Gather

OpenShift Must-gather 正在改在,希望也可以获 OLM细节: https://github.com/openshift/must-gather/pull/182/files.

获取全部信息

下面的命令会产生非常大的数据, 对故障排除来说有点笨重:

# oc adm inspect -A olm

特定的命名空间

如果你的问题被安装在特定的命名空间,请尝试以下命令:

# oc adm inspect olm -n <NAMESPACE>

故障排除一个处于‘hanging ’状态Operator 的安装

常规指南

如果 operator 没有被安装中,第一件要做的事是去查看各种安装对象的状态. 先查看‘Subscription’, 然后是 ‘InstallPlan’,最后检查 ‘ClusterServiceVersion’. 查看‘status’部分是否有错误或者警告.

查看命名空间为‘openshift-operator-lifecycle-manager’的‘catalog-operator’的pod日志也会有所帮助. 那里大概会有信息表明是错误或者是警告阻止了安装.
这篇文章不是针对失败安装的大致的故障排除. 但是这篇文章会持续更新, 也会关联其他知识库不同类型安装operator失败的文章. 然而大多数的解决方案需要从查看 OLM 资源开始, 命令如上.

手动批准InstallPlans的常见错误

如果你的 InstallPlan 要求手动 approve 升级, 这也会导致其他在相同命名空间或 Project下面的 InstallPlan也会要求手动通过. 这种情况是可预期且存在的, 因此安装或升级 Operator要求的所有依赖项可以被检查.

请注意 https://issues.redhat.com/browse/RFE-1282 被创建是为了更好的反映 OpenShift控制台.

特定的 Operator 安装及升级问题