8.2. VMware ESXi でストレージ障害の原因となる切断された接続の情報収集

システムおよびディスク情報を収集すると、接続が切断され、ストレージ障害の原因となっている可能性がある iSCSI ターゲットを特定できます必要であれば、この情報を Red Hat のグローバルサポートサービスに提供して、Ceph iSCSI ゲートウェイの問題のトラブルシューティングに役立てることもできます。

前提条件

  • 稼働中の Red Hat Ceph Storage クラスターがある。
  • iSCSI ターゲットとなる実行中の Ceph iSCSI ゲートウェイ。
  • iSCSI イニシエーターである実行中の VMware ESXi 環境。
  • VMware ESXi ノードへの root レベルのアクセス。

手順

  1. VWware ESXi ノードで、カーネルログを開きます。

    [root@esx:~]# more /var/log/vmkernel.log
  2. VMware ESXi カーネルログの以下のエラーメッセージから情報を収集します。

    2020-03-30T11:07:07.570Z cpu32:66506)iscsi_vmk:
    iscsivmk_ConnRxNotifyFailure: Sess [ISID: 00023d000005 TARGET:
    iqn.2017-12.com.redhat.iscsi-gw:ceph-igw TPGT: 3 TSIH: 0]

    このメッセージから、ISID 番号、TARGET 名、および Target Portal Group Tag (TPGT) 番号をメモします。この例では、以下のようになります。

    ISID: 00023d000005
    TARGET: iqn.2017-12.com.redhat.iscsi-gw:ceph-igw
    TPGT: 3

    2020-03-30T11:07:07.570Z cpu32:66506)iscsi_vmk:
    iscsivmk_ConnRxNotifyFailure: vmhba64:CH:4 T:0 CN:0: Connection rx
    notifying failure: Failed to Receive. State=Bound

    このメッセージから、アダプターチャネル (CH) 番号を書き留めます。この例では、以下のようになります。

    vmhba64:CH:4 T:0
  3. Ceph iSCSI ゲートウェイノードのリモートアドレスを検索するには、以下を実行します。

    [root@esx:~]# esxcli iscsi session connection list

    ...
    vmhba64,iqn.2017-12.com.redhat.iscsi-gw:ceph-igw,00023d000003,0
       Adapter: vmhba64
       Target: iqn.2017-12.com.redhat.iscsi-gw:ceph-igw 1
       ISID: 00023d000003 2
       CID: 0
       DataDigest: NONE
       HeaderDigest: NONE
       IFMarker: false
       IFMarkerInterval: 0
       MaxRecvDataSegmentLength: 131072
       MaxTransmitDataSegmentLength: 262144
       OFMarker: false
       OFMarkerInterval: 0
       ConnectionAddress: 10.2.132.2
       RemoteAddress: 10.2.132.2 3
       LocalAddress: 10.2.128.77
       SessionCreateTime: 03/28/18 21:45:19
       ConnectionCreateTime: 03/28/18 21:45:19
       ConnectionStartTime: 03/28/18 21:45:19
       State: xpt_wait
    ...

    コマンド出力から、以前に収集された ISID 値と TARGET の名前値を一致させ、RemoteAddress 値を書き留めます。この例では、以下のようになります。

    Target: iqn.2017-12.com.redhat.iscsi-gw:ceph-igw
    ISID: 00023d000003
    RemoteAddress: 10.2.132.2

    これで、Ceph iSCSI ゲートウェイノードからより多くの情報を収集し、問題のトラブルシューティングを行うことができます。

    1. RemoteAddress の値に示される Ceph iSCSI ゲートウェイノードで sosreport を実行して、システム情報を収集します。

      [root@igw ~]# sosreport
  4. デッドステートになったディスクを検索するには、以下を行います。

    [root@esx:~]# esxcli storage nmp device list

    ...
    iqn.1998-01.com.vmware:d04-nmgjd-pa-zyc-sv039-rh2288h-xnh-732d78fd-00023d000004,iqn.2017-12.com.redhat.iscsi-gw:ceph-igw,t,3-naa.60014054a5d46697f85498e9a257567c
       Runtime Name: vmhba64:C4:T0:L4 1
       Device: naa.60014054a5d46697f85498e9a257567c 2
       Device Display Name: LIO-ORG iSCSI Disk
    (naa.60014054a5d46697f85498e9a257567c)
       Group State: dead 3
       Array Priority: 0
       Storage Array Type Path Config:
    {TPG_id=3,TPG_state=ANO,RTP_id=3,RTP_health=DOWN} 4
       Path Selection Policy Path Config: {non-current path; rank: 0}
    ...

    コマンド出力から、以前に収集された CH 番号および TPGT 番号が一致し、Device の値を書き留めます。この例では、以下のようになります。

    vmhba64:C4:T0
    Device: naa.60014054a5d46697f85498e9a257567c
    TPG_id=3

    デバイス名を使用すると、各 iSCSI ディスクの追加情報を dead 状態で収集できます。

    1. iSCSI ディスクの詳細情報を収集します。

      構文

      esxcli storage nmp path list -d ISCSI_DISK_DEVICE > /tmp/esxcli_storage_nmp_path_list.txt
      esxcli storage core device list -d ISCSI_DISK_DEVICE > /tmp/esxcli_storage_core_device_list.txt

      [root@esx:~]# esxcli storage nmp path list -d naa.60014054a5d46697f85498e9a257567c > /tmp/esxcli_storage_nmp_path_list.txt
      [root@esx:~]# esxcli storage core device list -d naa.60014054a5d46697f85498e9a257567c > /tmp/esxcli_storage_core_device_list.txt

  5. VMware ESXi 環境に関する追加情報を収集します。

    [root@esx:~]# esxcli storage vmfs extent list > /tmp/esxcli_storage_vmfs_extent_list.txt
    [root@esx:~]# esxcli storage filesystem list > /tmp/esxcli_storage_filesystem_list.txt
    [root@esx:~]# esxcli iscsi session list > /tmp/esxcli_iscsi_session_list.txt
    [root@esx:~]# esxcli iscsi session connection list > /tmp/esxcli_iscsi_session_connection_list.txt
  6. iSCSI ログインの潜在的な問題の有無を確認します。

関連情報

  • Red Hat グローバルサポートサービス向けに sosreport を作成する方法 は Red Hat ナレッジベースソリューションを参照してください。
  • Red Hat グローバルサポートサービスの ファイルのアップロード に関する Red Hat ナレッジベースソリューションを参照してください。
  • カスタマーポータルで Red Hat サポートケース を作成する方法