sysctl tcp_frto=2 の場合、TCP リカバリーの問題により NFS がハングする
Issue
- この問題は当初、RHEL 5 から RHEL 6 へのアップグレード後に報告されました。これは、"net.ipv4.tcp_frto=2" (RHEL6 以降ではデフォルト) の場合、どの RHEL リリースでも発生する場合があります。
- 8 台の RHEL 5 サーバーで、RHEL 6 へのアップグレード (新規クリーンインストール) を開始しました。いくつかのサーバーをアップグレードした後で、RHEL 6 では、NFS へのトラフィックが少し増加すると NFS がロックアップすることが判明しました。
Jul 14 14:02:05 client kernel: nfs: server server not responding, still trying
Jul 14 14:02:10 client kernel: nfs: server server not responding, still trying
Jul 14 14:02:10 client kernel: nfs: server server not responding, still trying
Jul 14 14:02:38 client kernel: nfs: server OK
Jul 14 14:02:38 client kernel: nfs: server OK
この問題はいつでも再現できます。 ただし、これを同じネットワーク上の RHEL 5 サーバーで再現することはできません。 別のハードウェアや仮想マシンで再現することはできます。 RHEL5 などで使用したものと同じ NFS マウントオプションを使用していますが、毎回ロックアップが発生します。
Environment
- Red Hat Enterprise Linux
- NFS
Subscriber exclusive content
A Red Hat subscription provides unlimited access to our knowledgebase, tools, and much more.