Red Hat Training

A Red Hat training course is available for Red Hat Enterprise Linux

4.6. Advanced Error Reporting (AER)

4.6.1. AER とは

Advanced Error Reporting (AER) は、Peripheral Component Interconnect Express (PCIe) デバイスの拡張エラーレポートを提供するカーネル機能です。AER カーネルドライバーは、次の目的で PCIe AER 機能をサポートするルートポートを接続します。

  • エラーが発生した場合に包括的なエラー情報を収集する
  • ユーザーにエラーを報告する
  • エラー回復アクションを実行する

例4.1 AER 出力の例

Feb  5 15:41:33 hostname kernel: pcieport 10003:00:00.0: AER: Corrected error received: id=ae00
Feb  5 15:41:33 hostname kernel: pcieport 10003:00:00.0: AER: Multiple Corrected error received: id=ae00
Feb  5 15:41:33 hostname kernel: pcieport 10003:00:00.0: PCIe Bus Error: severity=Corrected, type=Data Link Layer, id=0000(Receiver ID)
Feb  5 15:41:33 hostname kernel: pcieport 10003:00:00.0:   device [8086:2030] error status/mask=000000c0/00002000
Feb  5 15:41:33 hostname kernel: pcieport 10003:00:00.0:    [ 6] Bad TLP
Feb  5 15:41:33 hostname kernel: pcieport 10003:00:00.0:    [ 7] Bad DLLP
Feb  5 15:41:33 hostname kernel: pcieport 10003:00:00.0: AER: Multiple Corrected error received: id=ae00
Feb  5 15:41:33 hostname kernel: pcieport 10003:00:00.0: PCIe Bus Error: severity=Corrected, type=Data Link Layer, id=0000(Receiver ID)
Feb  5 15:41:33 hostname kernel: pcieport 10003:00:00.0:   device [8086:2030] error status/mask=00000040/00002000

AER がエラーをキャプチャすると、error メッセージがコンソールに送信されます。エラーが修復可能な場合、コンソール出力は警告です。

4.6.2. AER メッセージの収集および表示

AER メッセージを収集して表示するには、rasdaemon プログラムを使用します。

手順

  1. rasdaemon パッケージをインストールします。

    ~]# yum install rasdaemon
  2. rasdaemon サービスを有効にして開始します。

    ~]# systemctl enable --now rasdaemon
  3. ログに記録されたエラーの概要を表示する (--summary オプション) か、エラーデータベースに保存されているエラーを表示する (--errors オプション) ras-mc-ctl コマンドを実行します。

    ~]# ras-mc-ctl --summary
    ~]# ras-mc-ctl --errors

関連情報

  • rasdaemon サービスの詳細は、rasdaemon(8) の man ページを参照してください。
  • ras-mc-ctl サービスの詳細は、ras-mc-ctl(8) man ページを参照してください。