NFS4.0: 高负载但 CPU 空闲 - 导致系统在 NFS4 挂载上打开文件完全中断
Issue
- 负载很快从大约 5 增长到 4000 多(有时高达 4500)。系统上有多个 webserver 进程运行,其中一个为我们提供在线服务。似乎这个特定的 webserver 导致了问题,因为系统保持响应,而且其他应用的 webservers 似乎没有问题。但是,在线服务网站非常慢,几乎完全中断。
- 此问题在最近 7 天内发生了两次,两此都导致我们的在线服务完全中断。两次问题都持续了大约 3 个小时,然后似乎消失了,我们并不知道为什么。如果问题再次出现,就非常紧急了!
- 一个 userid 短时间内在 NFS4 上打开/关闭大量文件的应用程序。
- 许多进程被阻止,等待 NFS4 / RPC 任务完成,RPC 任务被阻止在 Seqid_waitqueue 中
Environment
- Red Hat Enterprise Linux 6 (NFS 客户端)
- Red Hat Enterprise Linux 7 (NFS 客户端)
- 任何 NFS 服务器
- 使用 NetApp 查看
- NFS4.0
- 同一 userid 短时间内打开/关闭 NFS4 上大量文件的任何应用程序。
- 使用 httpd (apache) Web 服务器查看
- 使用顺序打开和关闭文件的 java 进程查看。
Subscriber exclusive content
A Red Hat subscription provides unlimited access to our knowledgebase, tools, and much more.