runc cgroup が呼び出す dbus イベントの読み取りおよび処理が systemd によって停止される
Issue
- 手作業での削除またはホストの再起動が実行されるまで、ノードで起動された Pod が
ContainerCreating
状態のままになる - OpenShift ノードが手作業で再起動されるまで、Pod は
Terminating
状態のままになります。 - ほとんどの デプロイ Pod が 1 日以上 deploy の状態であるため、デプロイメントに問題がありました。
docker
を使用してコンテナーを起動すると、/usr/bin/docker-current: Error response from daemon: containerd: container did not start before the specified timeout
というエラーで起動に失敗します。- 以下のような メッセージが
ジャーナル
に記録され、この特定のノードではdocker
を使用して新しいコンテナーを起動できません。
Jun 24 10:10:26 node123 crond[111309]: pam_systemd(crond:session): Failed to create session: Connection timed out
Jun 24 10:10:26 node123 systemd-logind[10714]: Failed to start user slice user-0.slice, ignoring: Connection timed out ((null))
Jun 24 10:10:51 node123 systemd-logind[10714]: Failed to start session scope session-13692.scope: Connection timed out
systemd
から奇妙なエラーメッセージが報告された後、DBus
に関連するさまざまな操作に失敗します。
Jun 04 14:03:35 node123 systemd[1]: Failed to propagate agent release message: Operation not supported
- コンテナーが ContainerCreating 状態のままになり、以下のメッセージがジャーナルログに記録されます。
Jan 01 01:01:01 hostname atomic-openshift-node: I0530 01:01:01.145075 91428 server.go:470] type: 'Warning' reason: 'FailedCreatePodSandBox' Failed create pod sandbox: rpc error: code = Unknown desc = failed to start sandbox container for pod "pod-name": Error response from daemon: oci runtime error: The maximum number of active connections for UID 0 has been reached
Environment
- Red Hat Enterprise Linux 7
- Openshift Container Platform 3.x
- systemd
Subscriber exclusive content
A Red Hat subscription provides unlimited access to our knowledgebase, tools, and much more.