在 OpenShift 中使用带有大量文件的 PV 的 pod 启动失败或启动需要花费大量时间
Issue
-
pod 部署失败,并显示以下信息:
Error: Failed to create pod sandbox: rpc error: code = Unknown desc = Kubelet may be retrying requests that are timing out in CRI-O due to system load: context deadline exceeded -
pod 启动失败,进入
CreateContainerError状态:mypod-5-1111a 0/1 CreateContainerError 0 7m29s - 当将卷附加到 Red Hat OpenShift Container Platform 中的 pod 时,为什么 pod 有时无法启动,或需要花费大量时间才能启动?
- 卷本身包括大量文件,通常有数万的文件和目录(或更多)。
- 对于没有使用包括大量文件的卷的 pod,可以非常快地进入
Ready状态(但无法访问卷提供的数据)。 - 有些时候,全部节点节点都会因为这个问题变为
NotReady,因为容器运行时 (docker或cri-o) 没有响应 (可以在docker ps或crictl ps命令中看到)。 - 在 OpenShift 中使用具有大量文件的持久卷(PV)时,为什么 pod 无法启动或要花费大量时间才能进入
Ready状态?
Environment
- Red Hat OpenShift Container Platform (RHOCP)
- 3
- 4
- Docker Container Engine
- CRI-O Container Engine
- SELinux
Subscriber exclusive content
A Red Hat subscription provides unlimited access to our knowledgebase, tools, and much more.