Red Hat Training
A Red Hat training course is available for Red Hat Enterprise Linux
4.6. Advanced Error Reporting (AER)
4.6.1. AER とは
Advanced Error Reporting
(AER
) は、Peripheral Component Interconnect Express
(PCIe
) デバイスの拡張エラーレポートを提供するカーネル機能です。AER
カーネルドライバーは、次の目的で PCIe
AER
機能をサポートするルートポートを接続します。
- エラーが発生した場合に包括的なエラー情報を収集する
- ユーザーにエラーを報告する
- エラー回復アクションを実行する
例4.1 AER 出力の例
Feb 5 15:41:33 hostname kernel: pcieport 10003:00:00.0: AER: Corrected error received: id=ae00 Feb 5 15:41:33 hostname kernel: pcieport 10003:00:00.0: AER: Multiple Corrected error received: id=ae00 Feb 5 15:41:33 hostname kernel: pcieport 10003:00:00.0: PCIe Bus Error: severity=Corrected, type=Data Link Layer, id=0000(Receiver ID) Feb 5 15:41:33 hostname kernel: pcieport 10003:00:00.0: device [8086:2030] error status/mask=000000c0/00002000 Feb 5 15:41:33 hostname kernel: pcieport 10003:00:00.0: [ 6] Bad TLP Feb 5 15:41:33 hostname kernel: pcieport 10003:00:00.0: [ 7] Bad DLLP Feb 5 15:41:33 hostname kernel: pcieport 10003:00:00.0: AER: Multiple Corrected error received: id=ae00 Feb 5 15:41:33 hostname kernel: pcieport 10003:00:00.0: PCIe Bus Error: severity=Corrected, type=Data Link Layer, id=0000(Receiver ID) Feb 5 15:41:33 hostname kernel: pcieport 10003:00:00.0: device [8086:2030] error status/mask=00000040/00002000
AER
がエラーをキャプチャすると、error メッセージがコンソールに送信されます。エラーが修復可能な場合、コンソール出力は警告です。
4.6.2. AER メッセージの収集および表示
AER メッセージを収集して表示するには、rasdaemon
プログラムを使用します。
手順
rasdaemon
パッケージをインストールします。~]# yum install rasdaemon
rasdaemon
サービスを有効にして開始します。~]# systemctl enable --now rasdaemon
ログに記録されたエラーの概要を表示する (
--summary
オプション) か、エラーデータベースに保存されているエラーを表示する (--errors
オプション)ras-mc-ctl
コマンドを実行します。~]# ras-mc-ctl --summary ~]# ras-mc-ctl --errors
関連情報
-
rasdaemon
サービスの詳細は、rasdaemon(8)
の man ページを参照してください。 -
ras-mc-ctl
サービスの詳細は、ras-mc-ctl(8)
man ページを参照してください。