E 系列存储系统上的介质扫描是什么?
适用于
- E 系列控制器固件 6.xx
- E 系列控制器固件 7.xx
- E 系列控制器固件 8.xx
问题解答
- 介质扫描是一个进程,启用后,它会在空闲时间运行以检查卷中的物理磁盘。
- 它会确保扇区可读,如果启用了冗余校验,还会检查 RAID 奇偶校验的一致性。
- 如果发现扇区问题或数据奇偶校验不匹配,则会将问题报告到主要事件日志 (MEL),以便用户及时了解问题所在。
- 该过程以预定的速率运行。
- 例如,如果启用时选择了 30 天的间隔(尽管此间隔可自定义),它将以 30 天完成的速率扫描该卷。
- 但是,由于介质扫描仅在空闲时间运行,因此实际完成时间可能会更长,因为它优先考虑主机 IO 而不是介质扫描操作。
- 操作完成后,它将自动重新启动,以便后台驱动器持续受到检查。
- 这种方法的局限性在于,只有当控制器扫描到驱动器中包含错误的部分时,才会发现问题。
- 因此,如果驱动器在最后一次扫描后的某一天出现坏扇区或损坏,则直到下次扫描该驱动器区域时(或直到在其他操作期间发现错误)才会检测到。
- 对主机 IO 的任何性能影响都可以忽略不计。
- 介质扫描将暂停以优先处理主机 IO,但初始响应时间可能会有非常短暂的延迟,以便从介质扫描切换到处理 IO。
- 在大多数情况下,这种延迟并不明显。
- MEL 中报告的介质扫描错误
报告的错误 |
描述 |
结果 |
未恢复的介质错误 |
第一次尝试或随后 2 次重试时均无法读取数据。 |
如果 3 次尝试中的任何一次成功,则数据将返回给主机。 如果读取重试不成功(RAID 0 除外),则尝试通过 VDD 修复进行错误纠正 |
已恢复的介质错误 |
驱动器在第一次尝试时无法读取请求的数据,但在后续尝试中成功。 |
数据被写入驱动器并进行验证。 |
冗余不匹配 |
发现冗余错误。 |
报告在逻辑驱动器上发现的前 10 个冗余不匹配情况。应执行操作系统数据检查操作。 |
无法修复的错误 |
无法读取数据,也无法使用奇偶校验或冗余信息来重新生成数据。 |
报告错误。 |
注意: MAJOR-EVENT-LOG
显示以下事件来指示任何给定卷上的介质扫描周期的开始和完成:
- 事件类型:0x2022
事件描述:介质扫描(清理)已开始 - 事件类型:0x2023
事件描述:介质扫描(清理)已完成
追加信息
VDD 修复:
VDD 修复首先从 RAID 条带中的数据 + 条带中的奇偶校验开始读取。
然后,VDD 修复根据条带的数据+奇偶校验计算位于驱动器不可读扇区中的数据。
如果数据从条带的其余部分的数据+奇偶校验成功重建,则读取将返回到主机。
如果 VDD 修复成功,则执行"写入验证" SCSI 操作。这会将重构的数据写入不可读扇区,然后立即将其读回。
如果 VDD 修复失败(由于另一个驱动器(在 RAID5 中)上的读取错误或 RAID 组降级(冗余不足)而无法重建数据),则 RAID 卷中受影响的 LBA 将被标记为"不可读扇区"(最终在 USM 日志中),并向主机返回错误。如果到达这个点,该 LBA 的数据就会丢失。
在后台,对驱动器的"坏"扇区进行写入验证将导致驱动器固件重新分配物理扇区(对 E-Series 控制器透明)。