del_recall_lru リストでの破損が原因で RHEL NFS サーバーがクラッシュする
Issue
- RHEL 6 NFS サーバーが以下のようなメッセージをログに記録する場合があります。
list_add corruption. next->prev should be prev (ffff880818ab3df0), but was ffff88078a1a48d0.(next=ffff88078a1a48d0).
- 以下のようなメッセージが記録された直後にパニックが発生します。
BUG: soft lockup - CPU#9 stuck for 67s![nfsd4:5319]
-
パニックを発生させるプロセスは 'nfsd4' (laundromat スレッドとも呼ばれる) です。
-
RHEL 5 NFS サーバーが以下のようなメッセージをログに記録する場合があります。
list_add corruption. prev->next should be ffffffff88593e10, but was ffff811362f1b648
その後パニックになります。パニックを発生させるプロセスが 'nfsd4' (laundromat スレッドとも呼ばれる) であるか、'nfsd' の主なスレッドの 1 つ (この場合 nfsd_break_deleg_cb() 関数はおそらくバックトレースになる) になります。
Environment
- Red Hat Enterprise Linux 6
- RHEL 6.1 および RHEL 6.3 カーネルで報告されました (6.5 以前のカーネルは影響を受けると推測されます)。
- Red Hat Enterprise Linux 5
- RHEL 5.10 カーネルで報告されました。また、その他のカーネルバージョンも影響を受ける可能性があります。
Subscriber exclusive content
A Red Hat subscription provides unlimited access to our knowledgebase, tools, and much more.