Owners Manual
68 排除存储设备故障
无效的存储设备
仅 Dell 支持的存储设备支持 RAID 控制器模块。 在存储设备中安装时,控制器将执行一组验证检
查。 RAID 控制器模块完成这些初始检测且控制器正常工作后,存储设备状态 LED 将呈蓝色稳定亮
起。 如果 RAID 控制器模块检测到非 Dell 支持的存储设备,则控制器将放弃启动。 如果存在无效的
存储设备,RAID 控制器模块不会生成任何事件来向您发出警报,但是存储设备状态 LED 将呈琥珀
色闪烁以表明故障状态。
有关 LED 及其解释的详细信息,请参阅
第
13
页的 “背面板指示灯和部件”。
ECC 错误
无论 RAID 控制器模块处于冗余配置还是非冗余配置, RAID 控制器固件均可以检测到 ECC 错误,
并可以从单位 ECC 错误中恢复。 由于同级 RAID 控制器模块可以接管 (如果有必要),因此配有
冗余控制器的存储阵列也可以从多位 ECC 错误中恢复。
如果 RAID 控制器模块遇到最多 10 个单位错误或最多三个多位错误,它将会进行故障时转移。
PCI 错误
当 RAID 控制器模块配置为用于冗余时,存储设备固件可以检测到并仅从 PCI 错误中恢复。 如果虚
拟磁盘使用高速缓存镜像,则该虚拟磁盘将故障时转移至同级 RAID 控制器模块,这表示对恶劣高
速缓存进行的刷新。
严重条件
如果 RAID 控制器模块检测到可能导致存储设备立即出现故障和 / 或数据丢失的严重情况,则存储
阵列将生成严重事件。 如果出现以下情况之一,则存储阵列处于严重情况:
•
多个风扇出现故障
•
任意背板温度传感器均处于临界范围
•
背板
/
电源设备出现故障
•
两个或多个温度传感器不可读
•
没有检测到或不能与双工配置中的同级进行通信
注: 如果两个 RAID 控制器模块同时出现故障,存储设备将无法发出关于任何存储设备组件的严重事件
警报或非严重事件警报。
存储设备处于严重情况下时,它的存储设备状态 LED 将呈琥珀色闪烁。
非严重条件
非严重情况是不会导致立即出现故障但必须进行更正以确保存储阵列持续可靠性的事件或状态。 非
严重事件示例包括:
•
一个电源设备出现故障
•
一个冷却风扇出现故障
•
冗余配置中的一个
RAID
控制器模块出现故障