RHEL 7.6:当 NFS 操作在进行中,且发生涉及意外 RST 的网络分区时,NFS 共享挂起
Issue
- 从 RHEL7.5 内核(3.10.0-862*el7)升级到 RHEL7.6 内核(3.10.0-957*el7)后,在网络分区和恢复后,NFS 客户端对 NFS 共享的读或写无限期挂起。
- NFS 共享挂起一个任务,如
kworker
,消耗 100% 的 CPU,/proc/<pid>/stack
或其他回溯追踪显示了 sunrpc 传输路径中的执行 - 进程无法终止,需要重启 NFS 客户端。
- 这是在 RHEL 7.6 之前的 RHEL 7 版本中没有看到的新行为
Environment
- Red Hat Enterprise Linux 7.6
- Red Hat Enterprise Linux 作为 NFS 客户端
- 内核至少
3.10.0-957.el7
且在3.10.0-957.5.1.el7
之前
- 内核至少
Subscriber exclusive content
A Red Hat subscription provides unlimited access to our knowledgebase, tools, and much more.