無効な rpc_xprt->snd_task ポインターが原因で RHEL 6 NFS クライアントが応答しなくなる

Solution Verified - Updated -

Issue

  • 6.3 にアップグレードしてから、クライアントにマウントした NFS が応答しなくなる問題がこれまでに複数回 (約 10 回) 発生しました。 df がハングアップし、そのマウントにアクセスするコマンドがハングアップします。
  • 同一クラスターの新しいノードからのマウントは成功します。 同一クラスターのスタックしているサーバーノードからの新しいマウントはハングします。
  • 複数サーバーが無作為に、ただし通常は 9 つの NFS 共有へのアクセスを失います。NFS サーバーは EMC ファイラーです。 その共有は TCP を使用しています。UDP での共有は影響を受けません。影響を受けたことがないサーバー上の同一の TCP での共有は正常です。 この問題の発生時、NFS サーバーでネットワークは利用でき、"showmount -e" 要求に適切に応答します。
  • (詳細な RPC デバッグが有効な場合は) 動作しない RPC 送信で作成された各 RPC 要求に "failed to lock transport" メッセージが表示され、NFS クライアントが応答できなくなります。

Environment

  • 当初は、Red Hat Enterprise Linux 6.3 (NFS クライアント) で発生しました。
    • 当初は kernel-2.6.32-279.14.1.el6 で発生しましたが、2.6.32-220.el6 から 2.6.32-358.2.1.el6 までのカーネルが影響を受けると考えられます。
  • 通常は NFSv3 プロトコルで発生していますが、バグが SUNRPC 層にあるためその他のプロトコル (NFS v4、NFS v4.1、NFSACL) にも影響を及ぼす可能性があります。
  • Isilon NFS サーバークラスター、EMC NFS サーバー、そして NetApp ファイラーで発生しています。

Subscriber exclusive content

A Red Hat subscription provides unlimited access to our knowledgebase of over 48,000 articles and solutions.

Current Customers and Partners

Log in for full access

Log In
Close

Welcome! Check out the Getting Started with Red Hat page for quick tours and guides for common tasks.