RHEL6.7.z で、2.6.32-573.10.2.el6 以上のカーネルを使用する NFS クライアントがハングアップし、not responding, still trying メッセージが表示され、プロセスが _spin_lock にてハングした状態となる
Issue
BUG: soft lockup メッセージが表示され、nfs_clear_request_commit
から呼び出した _spin_lock
で停止しているプロセスがあります。
flush スレッドを持つ NFS クライアントが、nfs_scan_commit
から呼び出した _spin_lock
で停止しました。
多くのプロセスを実行している NFS クライアントが _spin_lock
で停止し、nfs: server XYZ not responding, still trying が発生しました。
複数のプロセスが D 状態 (ディスクのスリープ) になり、戻ってきませんでした。"df" コマンドを実行しても戻らず、ハングアップします。"sudo" コマンドも有効ではありません。CPU を大量に消費するプロセスがないのにも関わらず、ロードアベレージが増加し続けます。最終的にはサーバーの再起動が必要になります。
この問題が発生すると、以下のようなメッセージが表示されます。
Feb 25 10:27:28 nfs-client kernel:[64627.406889] lockd: server nfs-server.example.com not responding, still trying
Environment
- Red Hat Enterprise Linux 6.7 (NFS クライアント)
- カーネルのバージョンが 2.6.32-573.10.2.el6 から 2.6.32-573.27.1.el6 の間
- カーネルのバージョンが 2.6.32-642.el6 以前
- NFS
Subscriber exclusive content
A Red Hat subscription provides unlimited access to our knowledgebase, tools, and much more.