smartpqi ドライバーが scsi バスをリセットした後にディスクアクセスが失われ、「Medium access timeout failure. Offlining disk!」が表示される
Issue
-
smartpqi ドライバーが以下のログを記録し、オフラインのディスクにアクセスできなくなります。
Jan 6 01:50:48 hostname kernel: smartpqi 0000:5c:00.0: resetting scsi 14:1:0:1 Jan 6 01:50:48 hostname kernel: smartpqi 0000:5c:00.0: reset of scsi 14:1:0:1: SUCCESS Jan 6 01:50:48 hostname kernel: sd 14:1:0:1: [sdb] Medium access timeout failure. Offlining disk! Jan 6 01:50:48 hostname kernel: sd 14:1:0:1: Device offlined - not ready after error recovery :
-
RAID の片方に障害が発生した際に、ハードウェア RAID1 にあるデバイスにアクセスできなくなったのはなぜですか?
- ハードウェア RAID1 の 1 つに障害が発生した後、システム上の対応するデバイスにアクセスできなくなりました。
-
ハードウェア RAID1 の 1 つで発生するエラーは、オペレーティングシステムに対して透過的である必要がありますが、なぜデバイスにアクセスできなくなったのですか?
Jun 4 06:02:08 localhost kernel: smartpqi 0000:12:00.0: resetting scsi 1:1:0:2 Jun 4 06:02:08 localhost kernel: smartpqi 0000:12:00.0: reset of scsi 1:1:0:2: SUCCESS Jun 4 06:02:08 localhost kernel: sd 1:1:0:2: [sdc] Medium access timeout failure. Offlining disk! Jun 4 06:02:08 localhost kernel: sd 1:1:0:2: Device offlined - not ready after error recovery : Jun 4 06:02:10 localhost kernel: XFS (sdc1): metadata I/O error: block 0x6fd0f0d0 ("xlog_iodone") error 5 numblks 64 Jun 4 06:02:10 localhost kernel: XFS (sdc1): xfs_do_force_shutdown(0x2) called from line 1200 of file fs/xfs/xfs_log.c. Return address = 0xffffffffc02f7ea0 Jun 4 06:02:10 localhost kernel: XFS (sdc1): Log I/O Error Detected. Shutting down filesystem Jun 4 06:02:10 localhost kernel: XFS (sdc1): Please umount the filesystem and rectify the problem(s)
-
デバイスを備えた RAID コントローラーは、明らかな理由もなくオフラインになります。
- コマンドがタイムアウトした後、ドライバーがリセットを行った後に smartpqi デバイスがオフラインになります。
- コマンドがタイムアウトした後、smartpqi が提供するデバイスは、ドライバー eh がリセットを実行した後にオフラインになります。
Environment
- Red Hat Enterprise Linux 6
- Red Hat Enterprise Linux 7
- smartpqi ドライバー
Subscriber exclusive content
A Red Hat subscription provides unlimited access to our knowledgebase, tools, and much more.