7.4. タイムアウトまたはポータルグループが見つからないことによる iSCSI ログイン失敗の確認

iSCSI ゲートウェイノードでは、デフォルトで /var/log/messages でタイムアウトが発生したり、システムログでターゲットポータルグループメッセージが見つからないことがあります。

例:

Mar 28 00:29:01 osd2 kernel: iSCSI Login timeout on Network Portal 10.2.132.2:3260

または、以下を実行します。

例:

Mar 23 20:25:39 osd1 kernel: Unable to locate Target Portal Group on iqn.2017-12.com.redhat.iscsi-gw:ceph-igw

システムがこの状態である間、この手順で提案されているシステム情報の収集を開始します。

前提条件

  • 稼働中の Red Hat Ceph Storage クラスターがある。
  • 実行中の Ceph iSCSI ゲートウェイ。
  • Ceph iSCSI ゲートウェイノードへの root レベルのアクセス。

手順

  1. 待機中のタスクのダンプを有効にして、ファイルに書き込みます。

    [root@igw ~]# dmesg -c ; echo w > /proc/sysrq-trigger ; dmesg -c > /tmp/waiting-tasks.txt
  2. 待機中のタスクのリストを見て、以下のメッセージを確認します。

    • iscsit_tpg_disable_portal_group
    • core_tmr_abort_task
    • transport_generic_free_cmd

    待機タスクリストにこれらのメッセージが表示されると、tcmu-runner サービスで何らかの問題が発生したことを示します。tcmu-runner サービスが正常に再起動しなかったか、tcmu-runner サービスがクラッシュしました。

  3. tcmu-runner サービスが実行中かどうかを確認します。

    [root@igw ~]# systemctl status tcmu-runner
    1. tcmu-runner サービスが実行していない場合は、tcmu-runner サービスを再起動する前に rbd-target-gw サービスを停止します。

      [root@igw ~]# systemctl stop rbd-target-gw
      [root@igw ~]# systemctl stop tcmu-runner
      [root@igw ~]# systemctl start tcmu-runner
      [root@igw ~]# systemctl start rbd-target-gw
      重要

      Ceph iSCSI ゲートウェイを停止すると、まず tcmu-runner サービスがダウンしても IO がスタックできなくなります。

    2. tcmu-runner サービスが実行されている場合には、これは新しいバグである可能性があります。新しい Red Hat サポートケースを作成します。

関連情報

  • Red Hat グローバルサポートサービス向けに sosreport を作成する方法 は Red Hat ナレッジベースソリューションを参照してください。
  • Red Hat グローバルサポートサービスの ファイルのアップロード に関する Red Hat ナレッジベースソリューションを参照してください。
  • カスタマーポータルで Red Hat サポートケース を作成する方法