Users Guide
高速缓存的内容实质上可以分为三部分:
• RAID 配置和元数据 — RAID 阵列的信息,包括配置信息、磁盘成员、磁盘角色等。
• 控制器日志 — RAID 控制器保持几个日志文件。戴尔技术人员依靠 TTY 日志作为主日志,用于故障排除各种 RAID 和硬盘驱动器
问题。
• RAID 数据 — 这是要写入单独的硬盘驱动器的实际数据。数据会写入直写和回写高速缓存策略模式下的控制器的高速缓存。
分片
跨同一组磁盘配置多个 RAID 阵列称为分片。
RAID 划伤
RAID 划伤是 Dell PowerEdge RAID 控制器 (PERC) 功能,旨在允许控制器还原阵列冗余性,无论是否因双冗余条件导致数据丢失。
RAID 划伤的另一个名称是错误重建。当 RAID 控制器检测到双故障并且冗余性不足以恢复受影响条带中的数据时,控制器会在该条带
中生成划伤并支持重建继续。
• 导致多个驱动器的同一条带中的数据无法访问的任何条件都是双故障。
• 双故障会导致受影响条带内的所有数据丢失。
• 所有 RAID 划伤都是双故障,但并非所有双故障都是 RAID 划伤。
RAID 划伤原因
如果没有 RAID 划伤功能,阵列重建将失败并且阵列处于降级状态。在某些情况下,故障可能会导致附加驱动器失败,并会导致阵列
处于未正常工作的脱机状态。阵列划伤不会影响在阵列上引导或访问任何数据的功能。
RAID 划伤可能出现以下两种情况之一:
• 存在双重故障(数据已丢失)。
联机驱动器上的数据错误繁殖(复制)到重建驱动器。
• 双重故障不存在(当发生第二次错误时数据已丢失)。
处于降级状态时,如果联机驱动器上发生坏块,则该 LBA 标记为 RAID 划伤。
阵列划伤的优势在于使系统在生产过程中可用,直到已存储阵列冗余。无论是否发生 RAID 划伤,受影响的磁条中的数据都会丢失。
此方法的主要缺点在于,当阵列中有 RAID 划伤时,无论是否访问受影响的数据(如果有),都会继续出现不可纠正的错误。
RAID 划伤可能出现在以下三个位置:
• 在不含数据的挡片空间。条带将无法访问,但因为在该位置中没有数据,它没有重大影响。任何由操作系统写入带 RAID 划伤的
条带的尝试均会失败,并且将写入到另一个位置。
• 在包含非重要数据的条带中,例如 README.TXT 文件。如果未访问受影响的数据,在正常 I/O 操作过程中不会生成错误尝试执行
文件系统备份将无法备份受 RAID 刺穿影响的任何文件。执行一致性检查或巡查读取操作将生成感知代码:3/11/00 适合适用的
LBA 和/或条带。
• 在访问的数据空间中。在这种情况下,丢失的数据可能导致多种错误。可能是小错误,不会在生产环境中产生不良影响。也可能
是更严重的错误,会妨碍系统操作系统引导或导致应用程序出现故障。
标记为 RAID 划伤的阵列最终会删除并重新创建以消除 RAID 划伤。此过程将导致所有数据被擦除。然后,消除 RAID 划伤后,需要重
新创建数据或从备份还原数据。RAID 划伤的解决办法可以计划在企业更需要的时间。
如果访问标记为 RAID 划伤的条带内的数据,将继续针对受影响的坏 LBA 报告并且无法纠正。最终(可能是数分钟、数天、数周、数
月等),坏块管理 (BBM) 表将填满,从而导致一个或多个驱动器被标记为可预测故障。按图中所示,驱动器 0 一般会被标记出现预
测故障,由于驱动器上的错误正在繁殖至驱动器 1 和驱动器 2。驱动器 0 可能实际上工作正常,并且更换驱动器 0 只会导致更换驱动
器最终也被标记出现预测故障。
90
硬件问题故障排除