在 smartpqi 驱动程序重置 scsi 总线后,无法访问磁盘,导致 "Medium access timeout failure.Offlining disk!" 错误
Issue
-
smartpqi 驱动程序有以下日志信息,无法访问离线磁盘
Jan 6 01:50:48 hostname kernel: smartpqi 0000:5c:00.0: resetting scsi 14:1:0:1 Jan 6 01:50:48 hostname kernel: smartpqi 0000:5c:00.0: reset of scsi 14:1:0:1: SUCCESS Jan 6 01:50:48 hostname kernel: sd 14:1:0:1: [sdb] Medium access timeout failure. Offlining disk! Jan 6 01:50:48 hostname kernel: sd 14:1:0:1: Device offlined - not ready after error recovery :
-
为什么当 RAID 的一个部分出现故障时,硬件 RAID1 中的一个设备无法被访问?
- 当硬件 RAID1 中的一个部分出现故障时,系统中对应的设备将无法被访问
-
对操作系统而言,硬件 RAID1 中的一个组件出现故障应该不会影响相关的操作,但为什么相关的设备无法被访问?
Jun 4 06:02:08 localhost kernel: smartpqi 0000:12:00.0: resetting scsi 1:1:0:2 Jun 4 06:02:08 localhost kernel: smartpqi 0000:12:00.0: reset of scsi 1:1:0:2: SUCCESS Jun 4 06:02:08 localhost kernel: sd 1:1:0:2: [sdc] Medium access timeout failure. Offlining disk! Jun 4 06:02:08 localhost kernel: sd 1:1:0:2: Device offlined - not ready after error recovery : Jun 4 06:02:10 localhost kernel: XFS (sdc1): metadata I/O error: block 0x6fd0f0d0 ("xlog_iodone") error 5 numblks 64 Jun 4 06:02:10 localhost kernel: XFS (sdc1): xfs_do_force_shutdown(0x2) called from line 1200 of file fs/xfs/xfs_log.c. Return address = 0xffffffffc02f7ea0 Jun 4 06:02:10 localhost kernel: XFS (sdc1): Log I/O Error Detected. Shutting down filesystem Jun 4 06:02:10 localhost kernel: XFS (sdc1): Please umount the filesystem and rectify the problem(s)
-
RAID 控制器中的设备因为不明的原因处于离线状态。
- 在一个命令超时后,一个 smartpqi 设备在驱动程序执行重置操作后处于离线状态
- 在一个命令超时后,驱动程序会执行重置操作,之后一个 smartpqi 设备会处于离线状态。
Environment
- Red Hat Enterprise Linux 6
- Red Hat Enterprise Linux 7
- smartpqi 驱动程序
Subscriber exclusive content
A Red Hat subscription provides unlimited access to our knowledgebase, tools, and much more.