Users Guide

Table Of Contents
分片
跨同一组磁盘配置多个 RAID 阵列称为分片。
RAID 划伤
RAID 划伤是 Dell PowerEdge RAID 控制器 (PERC) 功能,旨在允许控制器还原阵列冗余性,无论是否因双冗余条件导致数据丢失。
RAID 划伤的另一个名称是错误重建。当 RAID 控制器检测到双故障并且冗余性不足以恢复受影响条带中的数据时,控制器会在该条
带中生成划伤并支持重建继续。
导致多个驱动器的同一条带中的数据无法访问的任何条件都是双故障。
双故障会导致受影响条带内的所有数据丢失。
所有 RAID 划伤都是双故障,但并非所有双故障都是 RAID 划伤。
RAID 划伤原因
如果没有 RAID 划伤功能,阵列重建将失败并且阵列处于降级状态。在某些情况下,故障可能会导致附加驱动器失败,并会导致阵列
处于未正常工作的脱机状态。阵列划伤不会影响在阵列上引导或访问任何数据的功能。
RAID 划伤可能出现以下两种情况之一:
存在双重故障(数据已丢失)。
联机驱动器上的数据错误繁殖(复制)到重建驱动器。
双重故障不存在(当发生第二次错误时数据已丢失)。
处于降级状态时,如果联机驱动器上发生坏块,则该 LBA 标记为 RAID 划伤。
阵列划伤的优势在于使系统在生产过程中可用,直到已存储阵列冗余。无论是否发生 RAID 划伤,受影响的磁条中的数据都会丢失。
此方法的主要缺点在于,当阵列中有 RAID 划伤时,无论是否访问受影响的数据(如果有),都会继续出现不可纠正的错误。
RAID 划伤可能出现在以下三个位置:
在不含数据的挡片空间。条带将无法访问,但因为在该位置中没有数据,它没有重大影响。任何由操作系统写入带 RAID 划伤的
条带的尝试均会失败,并且将写入到另一个位置。
在包含非重要数据的条带中,例如 README.TXT 文件。如果未访问受影响的数据,在正常 I/O 操作过程中不会生成错误尝试执
行文件系统备份将无法备份受 RAID 刺穿影响的任何文件。执行一致性检查或巡查读取操作将生成感知代码:3/11/00 适合适用的
LBA /或条带。
在访问的数据空间中。在这种情况下,丢失的数据可能导致多种错误。可能是小错误,不会在生产环境中产生不良影响。也可能
是更严重的错误,会妨碍系统操作系统引导或导致应用程序出现故障。
标记为 RAID 划伤的阵列最终会删除并重新创建以消除 RAID 划伤。此过程将导致所有数据被擦除。然后,消除 RAID 划伤后,需要重
新创建数据或从备份还原数据。RAID 划伤的解决办法可以计划在企业更需要的时间。
如果访问标记为 RAID 划伤的条带内的数据,将继续针对受影响的坏 LBA 报告并且无法纠正。最终(可能是数分钟、数天、数周、数
月等),坏块管理 (BBM) 表将填满,从而导致一个或多个驱动器被标记为可预测故障。按图中所示,驱动器 0 一般会被标记出现预
测故障,由于驱动器上的错误正在繁殖至驱动器 1 和驱动器 2。驱动器 0 可能实际上工作正常,并且更换驱动器 0 只会导致更换驱动
器最终也被标记出现预测故障。
导致 RAID 划伤后执行一致性检查将无法解决问题。因此定期执行一致性检查非常重要。在可能的情况下,在更换之前这尤其重要。
阵列必须处于最佳状态以执行一致性检查。
RAID 阵列中包含单一数据错误以及其他错误事件,例如在阵列中重建故障后更换驱动器时硬盘驱动器故障导致 RAID 划伤。例如,
最佳的 RAID 5 阵列包括三个成员:驱动器 0、驱动器 1 和驱动器 2。如果驱动器 0 失败并更换,则驱动器 1 2 上剩余的数据和奇偶
校验用于在更换驱动器 0 上重建缺失的信息。但是,如果重建操作达到这个错误时驱动器 1 上存在数据错误,则条带内的信息不足以
重建该条带中缺失的数据。重建过程中,驱动器 0 没有数据,驱动器 1 上有坏数据和,驱动器 2 有良好的数据。条带内有多个错
误。驱动器 0 和驱动器 1 不包含有效的数据,因此条带中的任何数据都无法恢复并且因此丢失。结果如图 3 中所示,RAID 划伤(条
1 2)在重建期间创建。错误会繁殖到驱动器 0
硬件问题故障排除 77