Red Hat Training

A Red Hat training course is available for Red Hat Enterprise Linux

28.5. NVDIMM のトラブルシューティング

28.5.1. S.M.A.R.T. を使用した NVDIMM Health の監視

一部の NVDIMM は、ヘルス情報を取得する S.M.A.R.T.(Self-Monitoring, Analysis and Reporting Technology)インターフェースに対応しています。
NVDIMM 正常性を定期的に監視して、データの損失を防ぎます。「Broken NVDIMM の検出と置き換え」 で説明しているように、S.M.A.R.T. が NVDIMM のヘルス状態について問題を報告して、置き換えます。

前提条件

  • 一部のシステムでは、次のコマンドを使用して正常性情報を取得するために、acpi_ipmi ドライバーを読み込む必要があります。
    # modprobe acpi_ipmi

手順

  • 正常性情報にアクセスするには、次のコマンドを使用します。
    # ndctl list --dimms --health
    ...
        {
          "dev":"nmem0",
          "id":"802c-01-1513-b3009166",
          "handle":1,
          "phys_id":22,
          "health":
          {
            "health_state":"ok",
            "temperature_celsius":25.000000,
            "spares_percentage":99,
            "alarm_temperature":false,
            "alarm_spares":false,
            "temperature_threshold":50.000000,
            "spares_threshold":20,
            "life_used_percentage":1,
            "shutdown_state":"clean"
          }
         }
    ...