Users Guide
容错
PERC 10 系列支持以下功能:
● 自我监控和报告技术 (SMART)
● 巡检读取
● 物理磁盘故障检测
● 使用热备份重建物理磁盘
● 控制器高速缓存保留
● 电池和控制器高速缓存的非易失性高速缓存备份提供数据保护
● 引导后检测低电量电池
后续章节将介绍一些实现容错的方法。
SMART 功能
SMART 功能可监控所有电机、磁头和物理磁盘电子元件的内部性能,以检测出可预测的物理磁盘故障。与 SMART 兼容的物理磁盘
上的数据可被监控,以识别值的更改并确定这些值是否在阈值限制内。许多机械和电气故障会在故障之前表现出一些性能下降。
SMART 故障也称为可预测的故障。有许多因素可预测物理磁盘故障,例如轴承损坏、读/写磁头损坏以及转速时间变化。此外,还
有与读/写表面故障相关的因素,例如寻道错误率和坏扇区过多。
注: 有关 SCSI 接口规格的详情,请参阅 t10.org;有关 SATA 接口规格的详情,请参阅 t13.org。
自动更换具有预测故障的成员
当虚拟磁盘中的物理磁盘上报告存在 SMART 预测故障时,可能会发生更换成员操作。当第一个 SMART 错误发生在属于虚拟磁盘一
部分的物理磁盘上时,将启动自动更换成员。目标磁盘需要成为符合重建磁盘的热备份。只有在更换的成员成功完成后,包含
SMART 错误的物理磁盘才会被标记为失败。这可防止阵列达到降级状态。
如果使用最初是热备份(用于重建)的源磁盘时自动发生更换成员操作,并且为更换成员添加了新磁盘作为目标磁盘,则在成功完
成更换成员操作后,热备份驱动器将恢复到热备盘状态。
注: 要启用自动更换成员,请使用 Dell OpenManage 存储管理应用程序。
巡检读取
巡检读取功能设计为预防性措施,用于确保物理磁盘正常运行和数据完整性。巡检读取可以扫描并解决配置的物理磁盘上的潜在问
题。戴尔 OpenManage 存储管理应用程序可用于启动巡检读取并更改其行为。
下面概述了巡检读取行为:
● 对于配置为虚拟磁盘(包括热备份)一部分的控制器,巡检读取可以在其所有磁盘上运行。
● 巡检读取不能在不属于虚拟磁盘一部分的物理磁盘或处于就绪状态的物理磁盘上运行。
● 专用于巡检读取操作的控制器资源量根据未完成的磁盘 I/O 操作数量进行调整。例如,如果系统正忙于处理大量 I/O 操作,则巡
检读取将使用较少的资源,以使 I/O 获得更高的优先级。
● 巡检读取不能在涉及以下任何操作的磁盘上运行:
○ 重建
○ 更换成员
○ 完全初始化或后台初始化
○ CC
○ RLM 或 OCE
注: 默认情况下,在已配置的 SAS 和 SATA 硬盘上,巡检读取每七天自动运行一次。
有关巡检读取的更多信息,请参阅戴尔 OpenManage 说明文件:www.dell.com/openmanagemanuals。
功能
27