Users Guide
Table Of Contents
- Dell EMC PowerEdge 服务器 故障处理指南
- 目录
- 简介
- 诊断指示灯
- 运行诊断程序
- 硬件问题故障排除
- 故障处理系统启动故障
- 外部连接故障处理
- 视频子系统故障处理
- USB 设备故障处理
- 串行输入输出设备故障处理
- NIC 故障处理
- 受潮系统故障处理
- 受损系统故障处理
- 系统电池故障处理
- 冷却问题故障处理
- 冷却风扇故障处理
- 内部 USB 闪存盘故障处理
- micro SD 卡故障处理
- 扩展卡故障处理
- 处理器故障处理
- 存储控制器故障处理
- OMSA 标记的 PERC 驱动程序
- 使用“外部配置视图”屏幕导入或清除外部配置
- 使用“虚拟磁盘管理”菜单导入或清除外部配置
- RAID 控制器 L1、L2 和 L3 高速缓存错误
- PERC 控制器不支持 NVMe PCIe 驱动器
- 12 Gbps 硬盘驱动器不支持 SAS 6iR RAID 控制器
- 硬盘驱动器无法添加到现有的 RAID 10 阵列
- PERC 电池放电
- PERC 电池故障消息显示在 ESM 日志中
- 创建非 RAID 磁盘以供存储
- 固件或物理磁盘过时
- 因外部配置而无法引导到 Windows
- 具有保留高速缓存的虚拟驱动器脱机或丢失错误消息
- 扩展 RAID 阵列
- LTO-4 磁带机在 PERC 上不支持
- H310 上 HDD 大小的限制
- 系统日志显示存储控制器的故障条目,即使其正常工作
- 硬盘驱动器故障排除
- 光驱故障处理
- 磁带备份装置故障排除
- 故障排除无电源问题
- 电源装置故障处理
- 故障排除 RAID
- 使用 PERC 配置 RAID
- 使用 Unified Server Configurator 配置 RAID
- 使用 Unified Server Configurator 配置 RAID
- 在戴尔第 13 代 PowerEdge 服务器上通过使用 ESXi 主机上的 PERCCLI 工具下载和安装 RAID 控制器日志导出
- 通过使用 Lifecycle Controller 配置 RAID
- 虚拟磁盘重新配置和容量扩展的起始和目标 RAID 级别
- 装回 RAID1 配置中的物理磁盘
- RAID 配置指南
- 重新配置或迁移虚拟磁盘
- 外部配置操作
- 查看巡检读取报告
- 一致性检查报告
- 虚拟磁盘故障排除
- 故障排除 Dell PowerEdge 服务器的 PERC 控制器上的内存或电池错误
- 分片
- RAID 划伤
- 故障排除散热问题
- 在硬件配置上重新放置 SAS IOM 存储底座时发生输入/输出错误
- 服务器管理软件问题
- 什么是不同类型的 iDRAC 许可证
- 如何激活 iDRAC 上的许可证
- 是否可以将 iDRAC 许可证从 Express 升级到 Enterprise 或 从 BMC 升级到 Express
- 如何找出缺失的许可证
- 如何使用 iDRAC Web 界面导出许可证
- 如何设置电子邮件警报
- 系统时区未同步
- 如何设置自动专用 NIC 功能
- 如何使用 Lifecycle Controller 配置网络设置
- 使用 OMSA 分配热备盘
- 存储设备运行状况
- 如何使用操作系统部署向导配置 RAID
- 物理磁盘上的外部驱动程序
- 物理磁盘报告为外部
- 如何在第 13 代 PowerEdge 服务器上更新 BIOS
- 为什么无法更新固件
- Dell EMC PowerEdge 服务器上支持的操作系统
- 无法创建分区或找到分区并且无法安装 Microsoft Windows Server 2012
- iDRAC 中的 JAVA 支持
- 如何指定语言和键盘类型
- 消息事件 ID - 2405
- 在 Microsoft Windows 操作系统上安装管理系统软件
- 在 Microsoft Windows Server 和 Microsoft Hyper-V Server 上安装管理系统软件
- 在 VMware ESXi 上安装 Systems Management 软件
- 处理器 TEMP 错误
- 在计划的警告重新引导期间 PowerEdge T130、R230、R330 和 T330 服务器可能报告严重错误
- 未检测到 SSD
- OpenManage Essentials 无法识别服务器
- 无法通过交换机连接到 iDRAC 端口
- 在 UEFI 模式中 Lifecycle Controller 无法识别 USB
- 远程桌面服务指南
- 操系统问题故障排除
- 如何在戴尔 PowerEdge 服务器上安装操作系统
- 查找 VMware 和 Windows 许可
- 蓝屏错误或 BSOD 故障排除
- 紫屏死机或 PSOD 故障排除
- Windows 操作系统无引导问题故障处理
- iDRAC 中没有 POST 问题
- 故障排除无 POST 情况
- 使用 Dell Migration Suite for SharePoint 迁移至 OneDrive for Business
- Windows
- VMware
- Linux
- 通过多种方法安装操作系统
- 获取帮助
分片
跨同一组磁盘配置多个 RAID 阵列称为分片。
RAID 划伤
RAID 划伤是 Dell PowerEdge RAID 控制器 (PERC) 功能,旨在允许控制器还原阵列冗余性,无论是否因双冗余条件导致数据丢失。
RAID 划伤的另一个名称是错误重建。当 RAID 控制器检测到双故障并且冗余性不足以恢复受影响条带中的数据时,控制器会在该条
带中生成划伤并支持重建继续。
● 导致多个驱动器的同一条带中的数据无法访问的任何条件都是双故障。
● 双故障会导致受影响条带内的所有数据丢失。
● 所有 RAID 划伤都是双故障,但并非所有双故障都是 RAID 划伤。
RAID 划伤原因
如果没有 RAID 划伤功能,阵列重建将失败并且阵列处于降级状态。在某些情况下,故障可能会导致附加驱动器失败,并会导致阵列
处于未正常工作的脱机状态。阵列划伤不会影响在阵列上引导或访问任何数据的功能。
RAID 划伤可能出现以下两种情况之一:
● 存在双重故障(数据已丢失)。
联机驱动器上的数据错误繁殖(复制)到重建驱动器。
● 双重故障不存在(当发生第二次错误时数据已丢失)。
处于降级状态时,如果联机驱动器上发生坏块,则该 LBA 标记为 RAID 划伤。
阵列划伤的优势在于使系统在生产过程中可用,直到已存储阵列冗余。无论是否发生 RAID 划伤,受影响的磁条中的数据都会丢失。
此方法的主要缺点在于,当阵列中有 RAID 划伤时,无论是否访问受影响的数据(如果有),都会继续出现不可纠正的错误。
RAID 划伤可能出现在以下三个位置:
● 在不含数据的挡片空间。条带将无法访问,但因为在该位置中没有数据,它没有重大影响。任何由操作系统写入带 RAID 划伤的
条带的尝试均会失败,并且将写入到另一个位置。
● 在包含非重要数据的条带中,例如 README.TXT 文件。如果未访问受影响的数据,在正常 I/O 操作过程中不会生成错误尝试执
行文件系统备份将无法备份受 RAID 刺穿影响的任何文件。执行一致性检查或巡查读取操作将生成感知代码:3/11/00 适合适用的
LBA 和/或条带。
● 在访问的数据空间中。在这种情况下,丢失的数据可能导致多种错误。可能是小错误,不会在生产环境中产生不良影响。也可能
是更严重的错误,会妨碍系统操作系统引导或导致应用程序出现故障。
标记为 RAID 划伤的阵列最终会删除并重新创建以消除 RAID 划伤。此过程将导致所有数据被擦除。然后,消除 RAID 划伤后,需要重
新创建数据或从备份还原数据。RAID 划伤的解决办法可以计划在企业更需要的时间。
如果访问标记为 RAID 划伤的条带内的数据,将继续针对受影响的坏 LBA 报告并且无法纠正。最终(可能是数分钟、数天、数周、数
月等),坏块管理 (BBM) 表将填满,从而导致一个或多个驱动器被标记为可预测故障。按图中所示,驱动器 0 一般会被标记出现预
测故障,由于驱动器上的错误正在繁殖至驱动器 1 和驱动器 2。驱动器 0 可能实际上工作正常,并且更换驱动器 0 只会导致更换驱动
器最终也被标记出现预测故障。
导致 RAID 划伤后执行一致性检查将无法解决问题。因此定期执行一致性检查非常重要。在可能的情况下,在更换之前这尤其重要。
阵列必须处于最佳状态以执行一致性检查。
RAID 阵列中包含单一数据错误以及其他错误事件,例如在阵列中重建故障后更换驱动器时硬盘驱动器故障导致 RAID 划伤。例如,
最佳的 RAID 5 阵列包括三个成员:驱动器 0、驱动器 1 和驱动器 2。如果驱动器 0 失败并更换,则驱动器 1 和 2 上剩余的数据和奇偶
校验用于在更换驱动器 0 上重建缺失的信息。但是,如果重建操作达到这个错误时驱动器 1 上存在数据错误,则条带内的信息不足以
重建该条带中缺失的数据。重建过程中,驱动器 0 没有数据,驱动器 1 上有坏数据和,驱动器 2 有良好的数据。条带内有多个错
误。驱动器 0 和驱动器 1 不包含有效的数据,因此条带中的任何数据都无法恢复并且因此丢失。结果如图 3 中所示,RAID 划伤(条
带 1 和 2)在重建期间创建。错误会繁殖到驱动器 0。
硬件问题故障排除 77