Amazon AWS の "ena" ドライバーがハングしてリセットされ、"TX hasn't completed" と表示される
Issue
- AWS インスタンスのネットワークインターフェイスが断続的にハングしてリセットされ、次のログが表示されます。
ena: TX hasn't completed, qid X, index XXX. XXXXXXXX usecs from last napi execution, napi scheduled: 1
...
ena: NETDEV WATCHDOG: CPU: X: transmit queue X timed out 5208 ms
ena: Free uncompleted tx skb qid X idx 0xXXX
ena: ENA device version: 0.10
ena: ENA controller version: 0.0.1 implementation version 1
ena: Device reset completed successfully
- これは既知の解決済みの問題 ena driver TX timeouts leading to softirq hangs に似ていますが、エラーメッセージが異なります。
Environment
- Red Hat Enterprise Linux 9.6
kernel-5.14.0-570.16.1.el9_6.x86_64
- Amazon AWS EC2 インスタンス
enaElastic Network Adapter
- カーネルモジュール設定を確認するスクリプト:
modprobe -ac --show-exports
Subscriber exclusive content
A Red Hat subscription provides unlimited access to our knowledgebase, tools, and much more.