Red Hat Training
A Red Hat training course is available for RHEL 8
第31章 高度なエラー報告の使用
Advanced Error Reporting
(AER
) を使用すると、Peripheral Component Interconnect Express
(PCIe
) デバイスのエラーイベントの通知を受け取ります。RHEL はデフォルトでこのカーネル機能を有効にし、報告されたエラーをカーネルログに収集します。さらに、rasdaemon
プログラムを使用すると、これらのエラーが解析され、データベースに保存されます。
31.1. AER の概要
Advanced Error Reporting
(AER
) は、Peripheral Component Interconnect Express
(PCIe
) デバイスの拡張エラーレポートを提供するカーネル機能です。AER
カーネルドライバーは、次の目的で PCIe
AER
機能をサポートするルートポートを接続します。
- 包括的なエラー情報を収集する
- エラーをユーザーに報告する
- エラー回復アクションを実行する
AER
がエラーをキャプチャすると、error メッセージがコンソールに送信されます。修復可能なエラーの場合、コンソール出力は 警告 です。
例31.1 AER 出力の例
Feb 5 15:41:33 hostname kernel: pcieport 10003:00:00.0: AER: Corrected error received: id=ae00 Feb 5 15:41:33 hostname kernel: pcieport 10003:00:00.0: AER: Multiple Corrected error received: id=ae00 Feb 5 15:41:33 hostname kernel: pcieport 10003:00:00.0: PCIe Bus Error: severity=Corrected, type=Data Link Layer, id=0000(Receiver ID) Feb 5 15:41:33 hostname kernel: pcieport 10003:00:00.0: device [8086:2030] error status/mask=000000c0/00002000 Feb 5 15:41:33 hostname kernel: pcieport 10003:00:00.0: [ 6] Bad TLP Feb 5 15:41:33 hostname kernel: pcieport 10003:00:00.0: [ 7] Bad DLLP Feb 5 15:41:33 hostname kernel: pcieport 10003:00:00.0: AER: Multiple Corrected error received: id=ae00 Feb 5 15:41:33 hostname kernel: pcieport 10003:00:00.0: PCIe Bus Error: severity=Corrected, type=Data Link Layer, id=0000(Receiver ID) Feb 5 15:41:33 hostname kernel: pcieport 10003:00:00.0: device [8086:2030] error status/mask=00000040/00002000