Dell EMC PowerEdge 服务器 故障处理指南 August 2020 Rev.
注意、小心和警告 注: “注意”表示帮助您更好地使用该产品的重要信息。 小心: “小心”表示可能会损坏硬件或导致数据丢失,并告诉您如何避免此类问题。 警告: “警告”表示可能会导致财产损失、人身伤害甚至死亡。 © 2017 - 2020 Dell Inc. 或其子公司。保留所有权利。Dell、EMC 和其他商标是 Dell Inc.
目录 章 1: 简介........................................................................................................................................ 7 读者对象................................................................................................................................................................................. 7 建议工具...............................................................................................................................................................................
扩展卡故障处理.................................................................................................................................................................. 42 处理器故障处理.................................................................................................................................................................. 43 CPU 机器检查错误故障排除......................................................................................................................................43 存储控制器故障处理......
故障排除 Dell PowerEdge 服务器的 PERC 控制器上的内存或电池错误............................................................ 77 分片................................................................................................................................................................................. 79 RAID 划伤....................................................................................................................................................................... 79 故障排除散热问题.....................................
iDRAC 中没有 POST 问题................................................................................................................................................. 96 故障排除无 POST 情况......................................................................................................................................................97 使用 Dell Migration Suite for SharePoint 迁移至 OneDrive for Business....................................................................98 Windows......................................
1 简介 使用此指南,了解如何识别并诊断 Dell PowerEdge 服务器问题。 本指南特别介绍了以下信息: ● 提供与服务器操作系统、服务器硬件和服务器管理软件相关的问题的故障排除步骤。 ● 提供诊断指示灯的概览并说明如何使用指示灯代码以便于故障排除。 ● 列出了 Dell PowerEdge 服务器错误消息及其可能的原因,并提供建议的措施以修正。 注: 本指南并未涵盖 Dell PowerEdge 服务器上可能发生的每个问题,但仅重点关注比较频繁的常见问题。 主题: • • • • 读者对象 建议工具 说明文件资源 安全说明 读者对象 此故障排除指南中的信息主要面向负责管理 Dell PowerEdge 服务器的管理员,但对所有戴尔服务器的用户都非常有用。 建议工具 列出了在 Dell PowerEdge 服务器上执行故障排除任务必需的基本工具和设备。 ● 挡板锁钥匙 只有在系统配备有挡板时,方需使用挡板锁钥匙。 ● ● ● ● ● ● ● ● 1 号梅花槽螺丝刀 2 号梅花槽螺丝刀 Torx #T30 螺丝刀 1/4 英寸平头螺丝刀 4 号螺帽螺丝刀 塑料划片 接地腕带 防静电台垫 装配
1. 单击表中“Location”(位置)列下提供的文档链接。 2. 单击所需的产品或产品版本。 注: 要找到产品名称和型号,请参阅您的系统正面。 3. 在“Product Support”(产品支持)页面上,单击 Manuals & documents(手册和文档)。 ● 使用搜索引擎: ○ 在搜索框中键入文档的名称和版本。 表. 1: 系统其他说明文件资源 任务 说明文件 位置 设置系统 有关将系统安装和固定到机架中的更多信息,请 参阅机架解决方案随附的《Rail Installation Guide》(导轨安装指南)。 www.dell.com/poweredgemanuals 有关设置系统的信息,请参阅系统随附的 《Getting Started Guide》(使用入门指南)说明 文件。 配置系统 有关 iDRAC 的功能、配置和登录 iDRAC,以及远 www.dell.
表. 1: 系统其他说明文件资源 (续) 任务 说明文件 位置 Guide(Dell EMC SupportAssist Enterprise 用户指 南)。 有关合作伙伴计划企业系统管理的信息,请参阅 OpenManage Connections Enterprise Systems Management(OpenManage Connections 企业系 统管理)说明文件。 www.dell.com/openmanagemanuals 使用 Dell PowerEdge RAID 控 制器 要了解 Dell PowerEdge RAID 控制器 (PERC)、软 件 RAID 控制器或 BOSS 卡的功能以及部署卡的 信息,请参阅存储控制器说明文件。 www.dell.com/storagecontrollermanuals 了解事件和错误消息 有关系统固件和代理(用于监测系统组件)生成 的事件和错误消息的信息,请参阅“查找错误代 码”。 www.dell.
2 诊断指示灯 系统上的诊断指示灯指示操作和错误状态。 主题: • • • • • • • • • • 状态 LED 指示灯 系统运行状况和系统 ID 指示灯代码 iDRAC Quick Sync 2 指示灯代码 iDRAC Direct LED 指示灯代码 NIC 指示灯代码 电源设备指示灯代码 非冗余电源设备单元指示灯代码 硬盘驱动器指示灯代码 uSATA SSD 指示灯代码 内部双 SD 模块指示灯代码 状态 LED 指示灯 系统前面板上的状态 LED 指示灯在系统启动期间显示错误状态。 注: 系统处于关闭状态时无 状态 LED 指示灯亮起。要启动系统,将系统连接至正常工作的电源并按下电源按钮。 注: 状态 LED 指示灯始终熄灭并且仅在出现任何错误时呈琥珀色亮起。 表.
表. 2: 状态 LED 指示灯 (续) 图标 说明 状态 纠正措施 注: 有关受支持 PCIe 卡的更多信息,请参阅“扩展 卡安装原则”部分。 系统运行状况和系统 ID 指示灯代码 图 1: 系统运行状况和系统 ID 指示灯 表. 3: 系统运行状况和系统 ID 指示灯代码 系统运行状况和系统 ID 指示灯 代码 状态 呈蓝色稳定亮起 表示系统处于开启状态、系统运行良好并且系统 ID 模式处于不活动 状态。按下系统运行状况和系统 ID 按钮以切换到系统 ID 模式。 呈蓝色闪烁 表示系统 ID 模式处于活动状态。按下系统运行状况和系统 ID 按钮 以切换到 System Health (系统运行状况)模式。 稳定琥珀色 表示系统处于故障安全模式。如果问题仍然存在,请参阅“获得帮 助”部分。 呈琥珀色闪烁 指示系统正在遇到故障。检查系统事件日志或 LCD 面板(,如果挡 板上提供)是否存在特定错误消息 有关系统固件和代理(用于监测 系统组件)生成的事件和错误消息的信息,请参阅“查找错误代 码”,网址:qrl.dell.
表. 4: iDRAC Quick Sync 2 指示灯 (续) 无线指示灯代码 状态 纠正措施 呈白色快速闪烁五次,然后熄灭 指示 iDRAC Quick Sync 2 功能已禁用。 检查 iDRAC Quick Sync 2 功能是否已配置为被 iDRAC 禁用。如果问题仍然存在,请参阅“获得帮 助”部分。有关更多信息,请参阅“Integrated Dell Remote Access Controller User's Guide”(《集成戴 尔远程访问控制器用户指南》)(网址 www.dell.com/poweredgemanuals)或“Dell OpenManage Server Administrator User’s Guide” (《戴尔 OpenManage 服务器管理员用户指南》) (网址 www.dell.
表. 6: NIC 指示灯 (续) 状态 状态 链路指示灯呈琥珀色亮起和活动指示灯呈绿色闪烁 NIC 以低于其最高端口速度的速度连接到有效的网络并且正在发送或接 收数据。 链路指示灯呈绿色亮起和活动指示灯不亮 NIC 以低于其最高端口的速度连接到有效的网络并且未发送或接收数 据。 链路指示灯呈琥珀色亮起和活动指示灯不亮 NIC 以低于其最高端口速度的速度连接到有效的网络并且未发送或接收 数据。 链路指示灯呈绿色闪烁和活动指示灯不亮 可以通过 NIC 配置实用程序启用 NIC 识别。 电源设备指示灯代码 交流电源装置 (PSU) 有一个半透明照明手柄,可作为指示灯使用。直流电源装置有一个 LED 灯,也可以用作指示灯。指示灯可以指 示电源是否存在或电源是否发生故障。 图 4: AC PSU 状态指示灯 1. AC PSU 状态指示灯或手柄 表.
图 5: DC PSU 状态指示灯 1. DC PSU 状态指示灯 表. 8: DC PSU 状态指示灯 电源指示灯代码 状态 绿色 有效的电源已连接到 PSU,PSU 正常运行。 呈琥珀色闪烁 表示 PSU 出现问题。 不亮 未连接电源。 呈绿色闪烁 热插拔 PSU 时,PSU 指示灯呈绿色闪烁。这表示 PSU 在效率、功能组、运行状况和支持的电压方 面不匹配。 小心: 在纠正 PSU 不匹配情况时,请仅更换指示灯闪烁的 PSU。更换另外的 PSU 以构成匹配 的 PSU 对将导致错误状况,并且系统会出现意外关机。要从高输出配置更改为低输出配置或 反之,必须关闭系统电源。 小心: 如果使用两个 PSU,二者必须为相同类型且具有相同的最大输出功率。 小心: 不支持交流 PSU 和直流 PSU 混用,否则会触发不匹配的情况。 非冗余电源设备单元指示灯代码 按下自我诊断按钮对系统的非冗余电源单元 (PSU) 执行快速运行状况检查。 图 6: 非冗余 AC PSU 状态指示灯和自我诊断按钮 1.
2. AC PSU 状态指示灯 表. 9: 非冗余 AC PSU 状态指示灯 电源指示灯显示方式 状态 不亮 电源未连接或电源设备出现故障。 绿色 有效的电源已连接到 PSU,PSU 正常运行。 硬盘驱动器指示灯代码 每个硬盘驱动器托架都有一个活动 LED 指示灯和一个状态 LED 指示灯。指示灯提供有关硬盘驱动器的当前状态的信息。活动 LED 指 示灯指示硬盘驱动器当前是否正在使用中。状态 LED 指示灯指示硬盘驱动器的电源状况。 图 7: 硬盘驱动器指示灯 1. 硬盘驱动器活动指示灯 2. 硬盘驱动器状态 LED 指示灯 3. 硬盘驱动器 注: 如果硬盘驱动器处于高级主机控制器接口 (AHCI) 模式,状态 LED 指示灯不会亮起。 表.
uSATA SSD 指示灯代码 图 8: uSATA SSD 指示灯 1. uSATA SSD 活动指示灯 2. uSATA SSD 状态指示灯 3. uSATA SSD 注: 如果 SSD 处于 Advanced Host Controller Interface (AHCI)(高级主机控制器接口)模式,则状态指示灯(右侧)不工作并保 持熄灭状态。 表.
表.
3 运行诊断程序 运行诊断程序可帮助您识别系统出现问题的原因。诊断程序可检测系统的硬件,不需要其他设备,也不会丢失数据。 主题: • • • 通过 SupportAssist 接收自动支持 PSA/ePSA 诊断程序 在 Windows 操作系统中使用 WinDbg 调试 mini crash dump 文件 通过 SupportAssist 接收自动支持 Dell EMC SupportAssist 是可选的 Dell EMC 服务产品,可自动提供适用于您的 Dell EMC 服务器、存储设备和联网设备的技术支持。 通过在您的 IT 环境中安装和设置 SupportAssist 应用程序,您可以获得以下优势: ● 自动化问题检测 — SupportAssist 会监测您的 Dell EMC 设备,并以主动和预测方式自动检测硬件问题。 ● 自动化案例创建 — 当检测到问题后,SupportAssist 会自动向 Dell EMC 技术支持创建支持案例。 ● 自动收集诊断 — SupportAssist 可自动从您的设备收集系统状态信息并将其安全地上传到 Dell EMC。此信息由 Dell EMC 技术
表. 13: PSA/ePSA 错误代码 (续) 错误编号(PSA 和 ePSA) 错误消息 说明 步骤 PSA NA CPU - 检测到机器检查例外情 况 在涉及系统板的测试过程中发 生错误。 1. 更新到新的 BIOS 版本 2. 重复执行 PSA 诊断程序。 3. 如果失败问题依然存在,请 联系戴尔技术支持 CPU - 高速缓存完整性测试偏 差 在涉及系统板的测试过程中发 生错误。 1. 更新到新的 BIOS 版本 2. 重复执行 PSA 诊断程序。 3. 检查系统运行过程中的温度 并且检查通风未受阻。 4. 如果失败问题依然存在,请 联系戴尔技术支持 CPU - 高压散热条件。限制 (d)C.实际 (d)C 在涉及系统板的测试过程中发 生错误。 1. 更新到新的 BIOS 版本 2. 重复执行 PSA 诊断程序。 3. 检查系统运行过程中的温度 并且检查通风未受阻。 4. 如果失败问题依然存在,请 联系戴尔技术支持 内存 - 检测到并修复内存错误 在涉及系统的系统板或内存的 测试过程中发生错误。但是, 系统已自修复。 1. 关闭系统电源并重置内存模 块。 2.
表. 13: PSA/ePSA 错误代码 (续) 错误编号(PSA 和 ePSA) 错误消息 说明 步骤 2. 更新到新的 BIOS 版本 3. 重复执行 PSA 诊断程序。 4. 如果失败问题依然存在,请 联系戴尔技术支持。 ePSA 2000-0132 电池 - 电池无法提供充足的电 力 在涉及系统的主系统板或电池 的测试过程中发生错误。 1. 2. 3. 4. 硬盘 - 未检测到驱动器 您的系统 BIOS 报告当前没有报 告硬盘。如果是便携式笔记 本,则重置硬盘;如果是台式 机,则重置数据缆线的两端, 然后将电源电缆重置至驱动 器。重复执行 PSA 诊断程序。 如果已知正常的硬盘可用,请 查看系统中是否可以检测到良 好的驱动器,或在正常工作的 系统中尝试可疑驱动器。 1. 如果您没有硬盘 (HDD),这 可能是自动消息,无需操 作。 2. 如果您有硬盘,重新将硬盘 连接至系统板。 3. 更新到新的 BIOS。 4. 重复执行 PSA 诊断程序。 5.
表. 13: PSA/ePSA 错误代码 (续) 错误编号(PSA 和 ePSA) 错误消息 说明 步骤 PSA 1000-0147 PSA 光驱 — IDE 状态失败。 ePSA 2000-0147 ePSA 硬盘 — 自检 您的 CD 或 DVD 驱动器指示故 障。 1. 更新到新的 BIOS 版本 2. 关闭计算机并将光驱重新连 接至系统板。 3. 重复执行 PSA 诊断程序。 PSA 1000-0148 PSA 光驱 - BIST --(s) ePSA 2000-0148 被 2000-0151、2000-0152 替代 ePSA 光驱 - 不正确的状态 您的 CD 或 DVD 驱动器指示故 障。 1. 更新到新的 BIOS 版本 2. 关闭计算机并将光驱重新连 接至系统板。 3. 重复执行 PSA 诊断程序。 PSA NA 光驱 - 未检测到驱动器 您的 CD 或 DVD 驱动器指示故 障。 1. 更新到新的 BIOS 版本 2. 关闭计算机并将光驱重新连 接至系统板。 3.
表. 13: PSA/ePSA 错误代码 (续) 错误编号(PSA 和 ePSA) 错误消息 说明 步骤 3. 重复执行 PSA 诊断程序。 4.
表. 13: PSA/ePSA 错误代码 (续) 错误编号(PSA 和 ePSA) 错误消息 说明 步骤 断程序再次失败,请联系技术 支持解决问题。 PSA 2000-0233 PSA 系统板 - RTC 秒数未更新 ePSA 2000-0233(未与 UEFI BIOS 一起使用) ePSA RTC - 秒数未更新 PSA 1000-0234 PSA 系统板 - 等待 RTC 更新标 志设置超时 ePSA 2000-0234(未与 UEFI BIOS 一起使用) PSA 1000-0235 ePSA NA PSA 1000-0241 系统板 - HPET ePSA 不正确的 时间段。 ePSA 2000-0242(未与 UEFI BIOS 一起使用) PSA NA ePSA 2000-0243 PSA NA ePSA 2000-0245 在涉及系统的主系统板的测试 1. 更新到新版本。 过程中发生错误。如果检测到 2. 重复执行 PSA 诊断程序 内存错误,单独尝试内存模 3.
表. 13: PSA/ePSA 错误代码 (续) 错误编号(PSA 和 ePSA) 错误消息 说明 步骤 端口测试 USB 设备。尝试已知 正常的 USB 设备。 PSA NA ePSA 2000-0251 PSA NA 事件日志 - 日志中包含失败记 录。 这仅涉及服务器中的 BIOS 事 件。 1. 更新到新的 BIOS 版本 2. 重复执行 PSA 诊断程序。 系统板 - 数据错误。 多个内存 DIMM 出现故障,被 认定是由主板引起的问题。 1. 更新到新的 BIOS 版本 2. 重复执行 PSA 诊断程序。 3. 如果失败问题依然存在,请 联系戴尔技术支持 触摸板 - 未检测到指点杆/触摸 板 诊断工具未检测到鼠标、触摸 板或定点杆。电源系统关闭、 重置任何缆线连接并检查 BIOS,以确保未禁用触摸板或 鼠标。 1. 更新到新的 BIOS 版本 2. 如果已断开连接,则重新连 接鼠标、触摸板或定点杆。 3. 对于笔记本电脑,确保触摸 板处于活动状态。 4.
表. 13: PSA/ePSA 错误代码 (续) 错误编号(PSA 和 ePSA) 错误消息 说明 步骤 PSA NA LCD 面板 - 用户没有为 LCD BIST 提供输入 在 LCD BIST 测试中回答“否” (而不是“是”)时会出现此 错误。如果无法清楚地看到红 色、蓝色、绿白和白色屏幕以 及未失真的文本或者遇到颜色 问题,请会从新运行诊断,如 果屏幕显示正常,单击“是” 1. 更新到新的 BIOS 版本 2. 关闭您的计算机并重新连接 LCD 缆线。 3. 重复执行 PSA 诊断程序。 4. 如果失败问题依然存在,请 联系技术支持 LCD 面板 - 无法打开或关闭指 示灯 在诊断测试过程中无法打开或 关闭背光灯 1. 更新到新的 BIOS。 2. 关闭您的计算机并重新连接 LCD 缆线。 3. 重复执行 PSA 诊断程序。 4. 如果失败问题依然存在,请 联系技术支持 LCD 面板 - 无法使用 BIOS 界面 液晶显示屏 (LCD) 面板无法正 确显示 BIOS 屏幕,并且 BIOS 屏幕在 LCD 上不可见。 1. 更新到新的 BIOS。 2.
表. 13: PSA/ePSA 错误代码 (续) 错误编号(PSA 和 ePSA) 错误消息 说明 步骤 PSA 1000-0334 视频 - 用户报告未正确显示图 案 在颜色测试中回答“否”(而 不是“是”)时会出现此错 误。如果无法清楚地看到垂直 或水平颜色条并且无失真、线 条或颜色问题,请重新运行诊 断,如果颜色条显示正常,单 击 Yes(是)。 1. 在颜色测试中回答“否” (而不是“是”)时会出现 此错误。 2. 更新到新的 BIOS 版本 3. 关闭您的计算机并重新连接 LCD 缆线。 4. 重复执行 PSA 诊断程序。 5. 如果失败问题依然存在,请 联系戴尔技术支持 缆线 - 未检测到 正常情况下,错误中涉及的缆 线(例如 LCD LVDS CABLE) 将在错误消息中说明。重置缆 线连接并检查缆线和连接是否 有损坏。 1. 更新到新的 BIOS。 2. 关闭系统,然后重新连接错 误消息中所示的缆线、跳线 或连接。 3. 装回损坏的缆线或设备。 4. 重复执行 PSA 诊断程序。 5.
表. 13: PSA/ePSA 错误代码 (续) 错误编号(PSA 和 ePSA) 错误消息 说明 步骤 PSA NA 风扇 - 风扇无法正确响应 冷却风扇未响应诊断工具。请 检查风扇未受阻。 1. 更新到新的 BIOS 版本 2. 检查您的系统中是否阻碍了 通风孔或冷却风扇。 3. 重复执行 PSA 诊断程序。 4. 如果失败问题依然存在,请 联系戴尔技术支持 风扇 - 风扇的运行速度比预期 快。 这可能是系统板、温度传感器 或冷却风扇出现问题。请检查 所有内容稳固就位。 1. 更新到新的 BIOS 版本 2. 检查任何松动的连接、任何 通风孔受阻并了解任何其他 过热迹象。 3. 重复执行 PSA 诊断程序。 4. 如果失败问题依然存在,请 联系戴尔技术支持 网络 - 网络 [d] - {供应商生成的 网络(以太网)设备可能出现 故障。这可能是母板、适配器 错误} 或子卡问题,具体取决于系 统。错误包括 Register test failed 或 Packet loopback test failed。 1. 更新到新的 BIOS/固件版 本。 2.
表. 13: PSA/ePSA 错误代码 (续) 错误编号(PSA 和 ePSA) 错误消息 说明 步骤 3. 如果失败问题依然存在,请 联系戴尔技术支持 PSA NA ePSA 2000-8007 PSA NA ePSA 2000-8008 BIOS - 日志包含风扇事件或计 时器预计的 [d] 发现了 [d] 此消息仅供参考 – 提供了风扇 事件的记录。 1. 清除日志。 2. 重复执行 PSA 诊断程序。 3. 如果失败问题依然存在,请 联系戴尔技术支持 诊断 - A.内存不足!fMalloc() 失败! 系统可能不稳定,应该重新引 导。 1. 更新到新的 BIOS 版本 2. 重复执行 PSA 诊断程序。 3. 如果失败问题依然存在,请 联系戴尔技术支持 诊断 — 软件错误 系统可能不稳定,应该重新引 导。 1. 更新到新的 BIOS 版本 2. 重复执行 PSA 诊断程序。 3. 如果失败问题依然存在,请 联系戴尔技术支持 BIOS - 检索供应商 ID 功能错误 系统可能不稳定。 1. 更新到新的 BIOS 版本 2. 重复执行 PSA 诊断程序。 3.
表. 13: PSA/ePSA 错误代码 (续) 错误编号(PSA 和 ePSA) 错误消息 说明 步骤 PSA NA 诊断程序 - 无效参数传递到设 备。选择了未知测试 [d] 意外参数传递到测试的设备。 1. 更新到新的 BIOS 版本 2. 重复执行 PSA 诊断程序。 3. 如果失败问题依然存在,请 联系戴尔技术支持 诊断程序 - LCD [s] 不支持测试 命令 将 BIOS 更新到最新版本应当可 1. 更新到新的 BIOS 版本 以解决问题。 2. 重复执行 PSA 诊断程序。 3. 如果失败问题依然存在,请 联系戴尔技术支持 ePSA 2000-8014 诊断程序 - ADDF 模块 ([s]) 设 备 ([s]) 故障并显示错误代码 [x],编号 [x]。未映射 ePSA 哔 声代码! 诊断程序运行外部模块,并且 报告异常错误。 PSA NA 诊断程序 - 无法检索电池运行 状况 主板 BIOS 版本可能不是最新。 1. 2. 3. 4. BIOS - 电池 - BIOS 不支持电池 运行状况 此可选的功能可能不受支持。 1.
表. 13: PSA/ePSA 错误代码 (续) 错误编号(PSA 和 ePSA) 错误消息 说明 步骤 PSA NA 磁带机 - 磁带机 [d] - S/N [s]、 没有介质无法测试驱动器 插入可写磁带机介质。 1. 插入可写介质。 2. 重复执行 PSA 诊断程序。 3. 如果失败问题依然存在,请 联系戴尔技术支持 磁带机 - 磁带机 [d] - S/N [s], 驱动器不受支持 磁带机型号为未知,并且诊断 程序不支持。 1. 重置驱动器。 2. 使用已知正常的驱动器测试 (如果可能)。 3. 重复执行 PSA 诊断程序。 4. 如果失败问题依然存在,请 联系戴尔技术支持 底板 - [DRIVE] 驱动器 [d] - 错 误状态 = [x]、[s] 字符串指示底板、扩充器或可 移动硬盘驱动器报告不正确的 状态。 1. 重置驱动器/电缆/连接。 2. 重复执行 PSA 诊断程序。 3.
在 Windows 操作系统中使用 WinDbg 调试 mini crash dump 文件 前提条件 1. 单击开始 > 控制面板 > 系统。 图 9: 打开 Systems(系统)页面 2.
图 10: Advanced system settings(高级系统设置)页面 3. 在 System Properties(系统属性)窗口中,单击 Startup and Recovery(启动和恢复)部分下的 Settings(设置)。 图 11: System Properties (系统属性)窗口 4. 在 Startup and Recovery(启动和恢复)窗口中额的 System failure(系统故障)部分,执行以下操作: a.
b. 选择 Automatically Restart(自动重新启动)可在出现蓝屏死机后重新启动系统。 注: 对于服务器,建议您选择 Automatically Restart(自动重新启动)选项,以便在错误不严重时服务器可以正常工 作。 c. 验证 Overwrite any existing file(覆盖任何现有文件)选项未被选中。如果系统故障反复出现,这可确保维护故障的记录。 图 12: Startup and Recovery(启动和恢复)窗口 5. 出现 BSOD 时,通过导航到 C:\windows\minidump 选择 minidump 文件。 6. 从 https://msdn.microsoft.com/en-us/windows/hardware/hh852365.aspx 下载并安装 Windows Debugger (WinDbg) 工具。 步骤 1. 打开 WinDbg。 2. 单击 File(文件) → Symbol File Path(符号文件路径)或者按键盘上的 Ctrl + S。 3.
c. IMAGE_NAME 11.
4 硬件问题故障排除 本节帮助您诊断系统中的硬件问题。 注: 如果问题仍然存在,请联系戴尔技术支持以获取帮助。 主题: • • • • • • • • • • • • • • • • • • • • • • • • 排查系统启动故障 外部连接故障排除 视频子系统故障处理 USB 设备故障处理 串行输入输出设备故障处理 NIC 故障处理 受潮系统故障排除 受损系统故障排除 系统电池故障排除 冷却问题故障处理 冷却风扇故障排除 内部 U 盘故障排除 micro SD 卡故障处理 扩展卡故障处理 处理器故障处理 存储控制器故障处理 硬盘驱动器故障排除 光盘驱动器故障排除 磁带备份装置故障排除 故障排除无电源问题 电源装置故障处理 故障排除 RAID 故障排除散热问题 在硬件配置上重新放置 SAS IOM 存储底座时发生输入/输出错误 排查系统启动故障 如果在通过 UEFI 引导管理器安装操作系统后将系统引导至 BIOS 引导模式,系统会停止响应。为了避免这个问题,您必须引导至安 装操作系统的同一引导模式。 对于所有其它启动问题,请注意屏幕上显示的系统消息。 未找到可引导设备 对未找到可引导设备问题进行故障排
8. 9. 10. 11. 12. 13. 打开系统电源 要进入 UEFI,按 F2 键。 验证是否可以在控制器 BIOS 中检测到所有已安装的驱动器,如果无法检测到,请参阅对硬盘驱动器问题进行故障排除部分。 确保在 BIOS 中 RAID 设置已针对 SATA 驱动器设置为 RAID 模式。 保存设置,然后重新引导服务器。 如果问题仍然存在,请联系戴尔技术支持以获得进一步的帮助。 外部连接故障排除 对任何外部设备进行故障排除之前,确保所有外部电缆均已牢固地连接至系统上的外部连接器。 ● 比较系统的技术规格与外部设备以检查兼容性。 ● 检查外部设备的功能与其他类似系统,以确保设备工作正常。 ● 检查任何其他类似外部设备与该系统,以确保系统端口工作正常。 对于任何其他问题的联系方式,请参阅全局技术支持。 视频子系统故障处理 前提条件 注: 确保在 iDRAC 图形用户界面 (GUI) 的“虚拟控制台”下选中“本地服务器视频已启用”选项。如果未选中该选项,本地视频 将被禁用。 注: VGA 端口不能热插拔。 步骤 1. 检查显示器的线缆连接(电源和显示屏)情况。 2.
7. 重新启动系统。 8. 如果您的键盘工作正常,请进入系统设置程序,验证集成设备屏幕上已启用所有 USB 端口。如果您的键盘工作不正常,用户还 可以使用远程访问启用或禁用 USB 选项。 9. 如果系统不可访问,则重置系统内部的 NVRAM_CLR 跳线,并将 BIOS 还原为默认设置。请参阅“系统板跳线设置”部分 10. 在 IDRAC 设置实用程序中,确保将 USB 管理端口模式配置为自动或标准操作系统使用。 11. 重新连接,逐次打开 USB 设备的电源。 12. 如果某个 USB 设备导致了相同的问题,请关闭该设备,并将此 USB 线缆更换为工作状态正常的线缆,然后开启该设备。 后续步骤 如果所有故障处理均告失败,请参阅“获得帮助”部分。 iDRAC Direct 故障排除 - USB XML 配置 有关 USB 存储设备和系统配置的更多信息,请参阅 Integrated Dell Remote Access Controller User's Guide(集成戴尔远程访问控制器 用户指南),网址:www.dell.com/poweredgemanuals 步骤 1.
串行输入输出设备故障处理 前提条件 注: 串行端口不能热插拔。 步骤 1. 关闭系统和所有已连接至串行端口的外围设备。 2. 将串行接口线缆更换为可正常工作的线缆,并打开系统和串行设备。 如果问题得以解决,请使用已知正常的线缆更换接口线缆。 3. 关闭系统和串行设备,将串行设备更换为兼容的设备。 4. 打开系统和所有连接的外设。 后续步骤 如果问题仍然存在,请参阅“获得帮助”部分。 NIC 故障处理 前提条件 注: 网络子卡 (NDC) 插槽不能热插拔。 步骤 1. 运行相应的诊断测试。有关更多信息,请参阅可用诊断测试的“使用系统诊断程序”部分。 2. 重新启动系统,并检查与 NIC 控制器相关的任何系统信息。 3. 查看 NIC 接口上的相应指示灯: ● 如果链接指示灯未点亮,表明连接的线缆已断开。 ● 如果活动指示灯不亮,则网络驱动程序文件可能已损坏或缺失。 根据需要安装或更换驱动程序。有关详情,请参阅 NIC 说明文件。 ● 尝试使用另一条已知正常的网络线缆。 ● 如果问题仍然存在,请使用交换机或集线器上的其他连接器。 4.
受潮系统故障排除 前提条件 小心: 多数维修只能由经认证的维修技术人员进行。您只能根据产品说明文件中的授权,或者在联机或电话服务和支持团队的指 导下进行故障排除和简单维修。任何未经 Dell 授权的服务所导致的损坏均不在保修范围之列。请阅读并遵循产品附带的安全说 明。 步骤 1. 关闭系统和连接的外围设备,并断开系统与电源插座的连接。 2. 卸下系统护盖。 3. 从系统中卸下以下组件(如果已安装): ● ● ● ● ● ● ● ● ● ● ● ● ● ● 电源设备 光盘驱动器 硬盘驱动器 硬盘驱动器背板 USB 存储盘 硬盘驱动器托架 冷却导流罩 扩展卡提升板(如果已安装) 扩展卡 冷却风扇部件(如果已安装) 冷却风扇 内存模块 处理器和散热片 系统板 4. 使系统彻底干燥至少 24 小时。 5. 重新安装在步骤 3 中卸下的组件,扩展卡除外。 6. 安装系统护盖。 7. 打开系统和已连接的外围设备。 如果问题仍然存在,请参阅“获得帮助”部分。 8. 如果系统正常启动,请关闭系统,然后重新安装所有卸除的扩展卡。 9.
● ● ● ● ● ● ● ● 扩展卡提升板(如果已安装) 扩充卡 电源设备 冷却风扇部件(如果已安装) 冷却风扇 处理器和散热片 内存模块 驱动器托盘或固定框架 4. 确保所有电缆均已正确连接。 5. 安装系统护盖。 6. 运行相应的诊断测试。有关更多信息,请参阅“使用系统诊断程序”部分。 后续步骤 如果问题仍然存在,请参阅“获得帮助”部分。 系统电池故障排除 前提条件 小心: 多数维修只能由经认证的维修技术人员进行。您只能根据产品说明文件中的授权,或者在联机或电话服务和支持团队的指 导下进行故障排除和简单维修。任何未经 Dell 授权的服务所导致的损坏均不在保修范围之列。请阅读并遵循产品附带的安全说 明。 注: 如果长期(几个星期或几个月)关闭系统电源,则 NVRAM 可能会丢失系统配置信息。这种情况是由有故障的电池引起的。 注: 某些软件可能会导致系统时间加快或减慢。如果除了系统设置程序中的时间不正确外,系统看起来运行正常,则问题可能是 由软件而不是由有故障的电池引起的。 步骤 1. 在系统设置程序中重新输入时间和日期。 2. 关闭系统并断开系统与电源插座的连接,然后至少等待一小时。 3.
从 iDRAC web GUI: 1. 单击 Hardware > Fans > Setup。 2. 在 Fan Speed Offset 下拉列表中,选择所需的冷却级别,或将最低风扇速度设置为某个自定义值。 从 F2 System Setup(F2 系统设置) 1. 选择 iDRAC Settings > Thermal,并从风扇速度偏置或最低风扇速度中设置更高的风扇速度。 通过 RACADM 命令: 1. 运行命令 racadm help system.thermalsettings 有关更多信息,请参阅《Integrated Dell Remote Access Controller User's Guide》,网址:www.dell.
后续步骤 如果问题仍然存在,请参阅“获得帮助”部分。 micro SD 卡故障处理 前提条件 注: 某些 micro SD 卡在卡上具有物理写保护功能。如果打开了写保护开关,则 micro SD 卡不可写。 注: IDSDM 和 vFlash 插槽不能热插拔。 步骤 1. 进入系统设置程序,确保已启用内部 SD 卡端口。 2. 关闭系统,包括任何连接的外围设备,并断开系统与电源插座的连接。 3. 卸下系统护盖。 注: 当 SD 卡出现故障时,内部双 SD 模块控制器会通知系统。在下次重新启动时,系统将显示一则消息指明此故障。如果在 SD 卡出现故障时启用了冗余,系统会记录严重警报,并且机箱运行状况会降级。 4. 使用新的 micro SD 卡更换故障的 micro SD 卡。 5. 安装系统护盖。 6. 将系统重新连接至其电源插座,并开启系统和所有连接的外围设备。 7. 进入系统设置程序,确保将内部 SD 卡端口和内部 SD 卡冗余设置为所需模式。 验证是否将正确的 SD 卡设置为主 SD 卡。 8. 检查 micro SD 卡是否工作正常。 9.
10. 安装系统护盖。 11. 运行相应的诊断测试。请参阅“使用系统诊断程序”部分。 如果测试失败,请参阅“获得帮助”部分。 12. 对于在步骤 8 中卸下的每个扩展卡,执行以下步骤: a. b. c. d. e. 关闭系统和连接的外围设备,并断开系统与电源插座的连接。 卸下系统护盖。 装回其中一个扩展卡。 安装系统护盖。 运行相应的诊断测试。请参阅“使用系统诊断程序”部分。 后续步骤 如果问题仍然存在,请参阅“获得帮助”部分。 处理器故障处理 前提条件 小心: 多数维修只能由经认证的维修技术人员进行。您只能根据产品说明文件中的授权,或者在联机或电话服务和支持团队的指 导下进行故障排除和简单维修。任何未经 Dell 授权的服务所导致的损坏均不在保修范围之列。请阅读并遵循产品附带的安全说 明。 注: 处理器插槽不能热插拔。 步骤 1. 运行相应的诊断检测程序。请参阅“使用系统诊断程序”部分。 2. 关闭系统和连接的外围设备,并断开系统与电源插座的连接。 3. 卸下系统护盖。 4. 确保已正确安装了处理器和散热器。 5. 安装系统护盖。 6. 运行相应的诊断测试。请参阅“使用系统诊断程序”部分。 7.
存储控制器故障处理 小心: 多数维修只能由经认证的维修技术人员进行。您只能根据产品说明文件中的授权,或者在联机或电话服务和支持团队的指 导下进行故障排除和简单维修。任何未经 Dell 授权的服务所导致的损坏均不在保修范围之列。请阅读并遵循产品附带的安全说 明。 注: 对控制器进行故障处理时,请参阅针对您的操作系统和控制器的说明文件。 注: Mini-PERC 插槽不能热插拔。 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13.
● 配置中的部分物理磁盘已卸下并重新插入。 ● 虚拟磁盘中的所有物理磁盘在不同的时间卸下,然后重新插入。 ● 非冗余虚拟磁盘中的物理磁盘已卸下。 以下限制适用于待导入的物理磁盘: ● 实际导入期间,扫描到外部配置时物理磁盘的磁盘状态可能发生改变。外部导入仅在处于 Unconfigured Good(未配置良好)状 态的磁盘上执行。 ● 无法导入出现故障或处于脱机状态的磁盘。 ● 固件不允许导入超过八个的外部配置。 要管理外部配置: 步骤 1. 如果配置中的全部或部分物理磁盘在卸下后重新插入,则控制器会认为该磁盘拥有外部配置。请执行下列步骤: a. 选择 外部配置 以便将外部配置信息显示在 外部配置 屏幕上。 b. 按 键显示选项(导入、清除)。 注: 在执行导入操作前,必须将所有磁盘插入系统。 c.
步骤 1. 在引导过程中,在 BIOS 屏幕提示时按 组合键。 默认情况下,将显示虚拟磁盘管理屏幕。 2. 在虚拟磁盘管理屏幕上,高亮显示控制器编号。 3. 按 键显示可用操作。 4. 导航到外部配置选项,然后按向右箭头键显示可用操作: a. 导入 b. Clear(清除) 注: 验证外部视图页面中没有任何物理磁盘标记为丢失,并且所有磁盘在导入之前都按预期显示,以此确保虚拟磁盘包含所 有物理磁盘。 5. 选择导入以导入外部配置或选择清除以删除外部配置,然后按 键。 如果您导入配置,虚拟磁盘管理屏幕将会显示详细的配置信息。它包括有关磁盘组、虚拟磁盘、物理磁盘、空间分配和热备用的 信息。 RAID 控制器 L1、L2 和 L3 高速缓存错误 问题:RAID 控制器会生成 L1、L2 和 L3 错误。 解决方案:要解决此问题,请执行以下操作: 1. 2. 3. 4. 5.
解决方案:要修复此问题,请更新 BIOS 和 PERC 固件。以下步骤显示如何更新 BIOS 和 PERC 固件: 有四个方法更新 BIOS,下面是四种方法的步骤: 方法 1:适用于 UEFI 的戴尔更新软件包说明。 1. 2. 3. 4. 5. 6. 下载 BIOS 更新软件包:Dell.com/support。 显示出口合规声明窗口时,阅读协议,如果接受,单击“我接受”。 当显示“文件下载”窗口时,单击“保存”以将文件保存到硬盘。 您可以使用 UEFI Shell 可引导介质(如 USB 闪存盘)更新 BIOS。将文件复制到带有 UEFI shell 的可引导设备。 通过使用可引导设备将系统引导至 UEFI shell。 运行 uEFI Shell 下的可执行文件 .efi 文件。请按照刷新实用程序提供的说明进行操作。 您也可以直接从 BIOS 引导管理器加载该可执行文件,而不是 UEFI shell 的可引导介质: 1. 2. 3. 4. 5.
4. 下载并执行上述步骤中标识的任何前提条件,然后再继续。 5. 通过从 shell 执行“./SAS-RAID_Firmware_XXXXX_LN_XXXXX.BIN”运行更新。 6. 按照其余的提示执行更新。 共有两个方法更新 PERC 固件: 方法 1:Windows 更新软件包: 1. 2. 3. 4. 5. 6. 7. 下载 BIOS 更新软件包:Dell.com/support。 当显示“文件下载”窗口时,单击“保存”以将文件保存到硬盘。 浏览至文件下载位置并双击新文件。 读取对话框窗口中显示的版本信息。 下载并安装对话框中标识的任何前提条件,然后再继续。 单击“安装”按钮。 按照其余的提示执行更新。 方法 2:Linux 更新软件包: 1. 2. 3. 4. 5. 6. 下载 BIOS 更新软件包:Dell.com/support。 当显示“文件下载”窗口时,单击“保存”以将文件保存到硬盘。 通过从 shell 执行命令“/SAS-RAID_Firmware_XXXXX_LN_XXXXX.
5. 按空格键选择磁盘。 所选物理磁盘旁边将显示一个 X。 6. 选择确定。 固件或物理磁盘过时 问题:固件或驱动器过时会导致未知磁盘错误。 解决方案: ● 更新固件/PERC 控制器。 因外部配置而无法引导到 Windows 关于此任务 控制器中存在外部配置并且您无法引导到 Windows 时,请执行以下操作: 步骤 1. 将外部配置导入 RAID 控制器。请参阅使用 RACADM 导入外部配置。 2. 重建故障的硬盘驱动器。请参阅重建。 3. 升级 iDRAC 固件/PERC。请参阅下载驱动程序和固件。 具有保留高速缓存的虚拟驱动器脱机或丢失错误消息 错误消息: There are offline or missing virtual drives with preserved cache. Please check the cables and ensure that all drives are present. Press any key to enter the configuration utility.
3. 选择管理保留的高速缓存。 随即显示一条信息,建议您导入外部配置后再放弃保留的高速缓存,以免丢失属于外部配置的数据。确定是否要继续。 “Manage Preserved Cache”屏幕显示受影响的虚拟磁盘。 4.
步骤 1. 运行相应的诊断测试。请参阅“使用系统诊断程序”部分。 根据诊断检测程序的结果,按需要继续执行以下步骤。 2. 如果系统中存在 RAID 控制器且在 RAID 阵列中配置了硬盘驱动器,则执行下列步骤: a. 重新启动系统,并在系统启动期间按 F10 以运行 Dell Lifecycle Controller(生命周期控制器),然后运行硬件配置向导检查 RAID 配置。 有关 RAID 配置的信息,请参阅 Dell Lifecycle Controller 说明文件或联机帮助。 b. 确保正确配置 RAID 阵列的硬盘驱动器。 c. 将硬盘驱动器置于离线状态并重置驱动器。 d. 退出配置公用程序并允许系统引导至操作系统。 3. 确保已正确安装和配置控制器卡所需的设备驱动程序。有关更多信息,请参阅操作系统说明文件。 4. 重新启动系统并进入系统设置程序。 5.
图 13: PERC 配置实用程序虚拟磁盘管理屏幕 2. 要检查硬盘驱动器是否是 RAID 阵列的一部分,请执行以下操作: a. 按 Ctrl + N 以转至 PD Mgmt(物理磁盘管理)屏幕并查看是否有任何硬盘驱动器脱机或丢失。 图 14: PERC 配置实用程序物理磁盘管理屏幕 此表显示了硬盘驱动器状态 表.
常见问题 如何识别硬盘故障? 导致硬盘故障的可能原因包括逻辑、标头或机械故障。下表介绍了发生故障的硬盘的症状: 表. 15: 发生故障的硬盘的症状 症状 说明 硬盘发出噪音 硬盘发出噪音表明机头崩溃、轴承有噪音或者马达出现故障。 数据和磁盘错误 文件可能没有保存或程序可能会停止响应。 未检测到硬盘 操作系统无法检测到硬盘。 系统崩溃 蓝屏错误。 读写过程缓慢 硬盘上读取或写入数据出现延迟。 如果发生以下症状,执行以下步骤: 1. 检查硬盘是否正确安装。 2. 检查硬盘指示灯。有关更多信息,请参阅硬盘指示灯代码部分。 3. 对于带有 LED 指示灯的系统,请检查诊断 LED 指示灯。有关更多信息,请参阅“状态 LED 指示灯”部分。 注: 不同的系统可能有不同的诊断 LED 指示灯。 4. 对于带有 LCD 面板的系统,请检查以下错误代码: 表.
注: 对于常用的 Linux 操作系统,您还需要以下文件以确保顺利执行:- Lib_Utils-1.00-09.noarch.rpm 注: deleted.txt 文件始终存储在 MegaCli 文件夹中。 症状 硬盘驱动器产生噪音 说明 硬盘驱动器发出咔哒声或其他响亮的噪音。噪声可以是间歇性的,并且可能与读取或写入操作一致。 分辨率 1. 2. 3. 4.
步骤 1. 尝试使用其它 CD 或 DVD。 2. 如果问题持续存在,请进入系统设置程序,并确保已启用集成 SATA 控制器和驱动器的 SATA 端口。 3. 运行相应的诊断测试。 4. 关闭系统和连接的外围设备,并断开系统与电源插座的连接。 5. 如果已安装挡板,请将其卸下。 6. 卸下系统护盖。 7. 确保接口电缆已牢固地连接至光盘驱动器和控制器。 8. 确保电源电缆已正确连接至驱动器。 9. 安装系统护盖。 后续步骤 如果问题仍然存在,请参阅“获得帮助”部分。 磁带备份装置故障排除 前提条件 小心: 多数维修只能由经认证的维修技术人员进行。您只能根据产品说明文件中的授权,或者在联机或电话服务和支持团队的指 导下进行故障排除和简单维修。任何未经 Dell 授权的服务所导致的损坏均不在保修范围之列。请阅读并遵循产品附带的安全说 明。 步骤 1. 使用不同的磁带盒。 2. 确保已正确安装和配置磁带备份装置的设备驱动程序。有关设备驱动程序的更多信息,请参阅磁带驱动器说明文件。 3. 按照磁带备份软件说明文件中的说明重新安装磁带备份软件。 4. 确保磁带驱动器的接口电缆连接至控制器卡上的外部端口。 5.
电源装置故障处理 前提条件 小心: 多数维修只能由经认证的维修技术人员进行。您只能根据产品说明文件中的授权,或者在联机或电话服务和支持团队的指 导下进行故障排除和简单维修。任何未经 Dell 授权的服务所导致的损坏均不在保修范围之列。请阅读并遵循产品附带的安全说 明。 以下各节提供关于电源和电源设备单元问题故障处理的信息。 电源问题故障排除 步骤 1. 按电源按钮以确保开启系统。如果在按下电源按钮时电源指示灯不亮,请紧紧地按下电源按钮。 2. 插入另一个可以正常工作的电源设备,确保系统板无故障。 3. 确保没有任何松动的连接。 例如,松动的电源电缆。 4. 确保电源符合适用标准。 5. 确保没有短路。 6. 请合格的电工检查线路电压,确保电压符合所需的规格。 结果 注: 一些电源装置需要 200-240 V AC 来提供额定容量。有关更多信息,请参阅“Installation and Service Manual”(安装和服务 手册)中的“系统技术规格”部分,网址:www.dell.com/poweredgemanuals。 电源设备故障排除 步骤 1.
要使用 LC 配置 RAID,请完成以下步骤: 1. 启动 Lifecycle Controller。有关详情,请参阅 Lifecycle Controller User's Guide(Lifecycle Controller 用户指南)可从 www.dell.com/ idracmanuals 上获取 。 2. 在左侧窗格中,单击 Hardware Configuration(硬件配置)。 3. 在右侧窗格中,单击“Configuration Wizards”。 4. 在“Storage Configuration Wizard”下,单击“RAID Configuration”以启动向导。 将显示 View Current RAID Configuration and Select Controller(查看当前的 RAID 配置并选择控制器)页。 注: 仅在 RAID 1 级别支持 BOSS-S1 控制器。 5. 选择要使用的控制器,然后单击“Next”。 将显示 Select RAID Level(选择 RAID 级别)页。 6.
重建 选择“Rebuild”以重建一个或多个出现故障的物理磁盘。 若干控制器配置设置和虚拟机设置会影响重建的实际速度。这些因素包括重建速度设置、虚拟磁盘条带大小、虚拟磁盘读取策略、 虚拟磁盘写入策略和存储子系统上的工作负载量。有关从 RAID 控制器获得最佳重建性能的信息,请参阅说明文件:www.dell.com/ storagecontrollermanuals。 下表中列出的速度适用于单磁盘故障并且无 I/O 的情况。速度取决于阵列中的硬盘驱动器类型、速度和个数、以及所用的控制器型 号和机柜配置。 表. 17: 估算的重建率 RAID 级别 硬盘驱动器数 7.
步骤 1. 在引导过程中,在 BIOS 屏幕提示时按 Ctrl + R。 默认情况下,将显示虚拟磁盘管理屏幕。 2. 在虚拟磁盘管理屏幕上,高亮显示控制器编号。 3. 按 F2 键显示可用操作。 4. 导航到外部配置选项,然后按向右箭头键显示可用操作: ● 导入 ● Clear(清除) 注: 验证外部视图页面中没有任何硬盘驱动器标记为丢失,并且所有磁盘在导入之前都按预期显示,以此确保虚拟磁盘包含 所有硬盘驱动器。 5. 选择导入以导入外部配置或选择清除以删除外部配置,然后按 键。 如果您导入配置,虚拟磁盘管理屏幕将会显示详细的配置信息。它包括有关磁盘组、虚拟磁盘、硬盘驱动器、空间分配和热备用 的信息。 后续步骤 您可以使用 OpenManage Server Administrator 导出 TTY PERC 控制器日志以分析问题的原因。 如果您已将发生故障的驱动器更换为可正常工作的驱动器,自动重建不起作用。您必须配置热备用以重建 RAID 卷。 如果控制器固件已过时,则更新固件/PERC 控制器。 分配热备用 步骤 1.
2. 单击 PERC Controller(PERC 控制器)。 3. 单击 Virtual Disks(虚拟磁盘)。 将会显示在控制器<控制器名称>上的虚拟磁盘页。 4. 单击转到创建虚拟磁盘向导。 将会显示 Create Virtual Disk Wizard (创建虚拟磁盘向导<控制器名称>)页面。 5. 从下拉列表选择 Express Wizard(快速向导)选项和 RAID level(RAID 级别)。 6. 单击 继续。 Create Virtual Disk Express Wizard - (创建虚拟磁盘快速向导 — <控制器名称>)页面显示所选 RAID 级别 的属性的摘要。属性包括总线协议、条带元素大小、读取策略以及选定的物理磁盘。建议在虚拟磁盘属性的默认值中不包括 RAID 级别为所选 RAID 级别。 7.
如果您选择否,则基于存在于系统中的物理磁盘总数,有不同的 RAID 级别可用。 7. 从下拉列表选择所需的 RAID 级别。 8. 选择 Bus Protocol(总线协议)。 提供的选项包括: ● SAS ● SATA 9. 选择 Media Type(介质类型)。 可用的选项有: ● HDD ● SSD 10.
12. 在名称字段中,键入虚拟磁盘的名称。 虚拟磁盘名称可以仅包含字母数字字符、空格、连字符和下划线。最大长度取决于控制器。在大多数情况下,最大长度为 15 个 字符。 此名称不能以空格开头和结尾。如果您拥有的虚拟磁盘具有相同的名称,将很难区分生成的警报,因此戴尔建议您为每个虚拟磁 盘指定唯一名称。 13.
使用 Unified Server Configurator 配置 RAID Unified Server Configurators (USC) 的主要功能包括操作系统部署、固件更新、硬件配置和诊断。UEFI 规范可以为许多功能强大的应 用程序创建框架,无需操作系统即可运行。UEFI 规范包括可信计算组 (TCG) 协议,允许可信平台模块 (TPM) 测量和安全更新以便 USC 进行重新利用。 步骤 1. 选择 RAID configuration(RAID 配置)选项卡以创建作为引导设备的虚拟磁盘 2. 在 View Current Configuration(查看当前配置)屏幕上,您可以查看系统中安装的当前控制器和虚拟磁盘的列表。 a. 如果虚拟磁盘或磁盘已存在于系统中,请单击 Exit(退出)以退出屏幕,并继续安装操作系统。如果系统中不存在虚拟磁盘 或磁盘,则继续新虚拟磁盘创建过程。 3.
图 15: Unified Server Configurator 的 RAID 配置过程流程图 5. 快速向导选项可选择合适的磁盘,具体取决于为创建虚拟磁盘所选择的 RAID 类型。 此时将会显示 Summary(摘要)屏幕。您可以查看在 Express Wizard(快速向导)中选择选项。 6. 单击 Finish(完成)可创建用于操作系统安装的虚拟磁盘。 7. Advanced(高级)选项会将您引导至一系列更多屏幕。在 Basic Settings(基本设置)屏幕上选择 RAID 类型。在 Select Physical Disks(选择物理磁盘)屏幕上,选择属于虚拟磁盘的一部分的物理磁盘。 将显示 Additional Settings(其他设置)屏幕以定义虚拟磁盘的其他参数,例如条带元素大小、读取和写入策略以及是否分配热 备用磁盘。显示虚拟磁盘属性的 Summary(摘要)。 8.
2. 要将 PERCCLI 工具上传到数据存储: a. 选择“host”(1),然后单击“Configuration”选项卡 (2)。 b. 在“Hardware”面板中,选择“Storage”(3),然后右键单击“datastore1”。 图 16: vSphere Client a. 在“Datastore Browser”中,单击“Upload”,然后单击“Upload File”。 图 17: 数据存储浏览器 3. 要启用 Secure Socket Shell (SSH),选择“host”(1),然后单击“Configuration”选项卡 (2)。在“Software”面板中,选择 “Security Profile”(3)。在“Services”中,单击屏幕右上角的“Properties”(4)。 图 18: Configuration(配置)选项卡 a. 在“Services properties”窗口中,选择“SSH”(1),然后单击“Options...
图 19: 打开“SSH Options” b.
4. 要解压缩 vmware-esx-perccli,通过 PUTTY 打开 SSH 连接并运行命令:unzip /vmfs/volumes/datastore1/vmwareesx-perccli-1.05.08.zip PuTTY 是免费的开放源代码终端仿真器、串行控制台和网络文件传输应用程序。它支持多种网络协议,包括 SCP、SSH、 Telnet、rlogin 和原始插槽连接。您可以从 Google 下载。文件 vmware-esx-perccli-1.05.08.vib 和 Readme.txt 现已解压到:/vmfs/ volumes/datastore1/ 警告: 请根据您的安装软件包检查正确的路径(例如,datastore1) 5. 通过使用以下命令安装 PERCCLI:esxcli software vib install -v /vmfs/volumes/datastore1/vmware-esxperccli-1.05.08.vib --no-sig-check 图 21: 安装 PERCCLI 6.
8. 通过使用以下命令将 MegaSAS.log 复制到数据存储:cp /opt/lsi/perccli/MegaSAS.log /vmfs/volumes/ datastore1/ 9. 使用数据存储浏览器将文件复制到桌面。 图 23: 数据存储浏览器中的日志文件 现在日志已导出到戴尔第 13 代 PowerEdge 服务器上的 ESXi 主机中。 通过使用 Lifecycle Controller 配置 RAID 前提条件 如果系统含有固件为 PERC 8 或更高版本的一个或多个受支持的 PERC RAID 控制器或软件 RAID 控制器,则可以使用 RAID 配置向导 将虚拟磁盘配置为引导设备。 注: 仅从系统的 0-3 插槽中填充的磁盘驱动器创建引导虚拟磁盘。有关插槽的信息,请查阅用户手册,网址:www.dell.com/ poweredgemanuals。 步骤 1.
b. 在“View Log History”页面中,您可以验证 RAID 操作是否成功。有关 Dell Lifecycle Controller 的更多信息,请转至 Dell.com/ techcenter/LC。 有关 Dell Lifecycle Controller 的 RAID 配置视频的更多信息,请转至 https://www.youtube.com/watch?v=JFPmeHNENV4 虚拟磁盘重新配置和容量扩展的起始和目标 RAID 级别 创建虚拟磁盘后,可根据控制器、RAID 级别和可用的物理磁盘重新配置虚拟磁盘。 表.
步骤 1. 在 Virtual Disk Management(虚拟磁盘管理)窗口中,选择 Virtual Disk #(虚拟磁盘编号),并按向下箭头键高亮显示物理 磁盘。 2. 按向右箭头键展开属于该虚拟磁盘的物理磁盘列表。 3. 按向下箭头键直到高亮显示希望更换的物理磁盘。按下 以展开磁盘上允许的操作列表。 4. 选择更换。 5. 选择开始。 6. 按向下箭头键高亮显示更换磁盘,然后按空格键选择该磁盘。 7.
表.
要避免解锁外部配置并继续预览、导入或清除尚未锁定的外部配置,请在 PERC BIOS Configuration Utility Foreign Configuration (PERC BIOS 配置实用程序外部配置)屏幕中,单击 Skip(跳过)或 Continue(继续)。 如果不想导入或清除外部配置,或者相应密钥标识符的相关密码短语丢失,则对物理磁盘执行即时加密擦除任务。 小心: 执行“即时加密擦除”任务时,将擦除物理磁盘上的所有数据。 有些情况(比如不支持的 RAID 级别或不完整的磁盘组)会阻止导入或恢复外部虚拟磁盘。 外部配置属性 下表介绍了适用于外部磁盘和全局热备用的 PERC BIOS Configuration Utility Foreign Configuration(PERC BIOS 配置实用程序 外部配置) 屏幕上显示的属性。 表.
根据属性信息,可以决定是否要导入、恢复或清除外部配置。 查看巡检读取报告 巡检读取报告提供有关按时间顺序中在控制器上执行的巡检读取的所有信息。它提供诸如上次运行时间和结果的信息。如果巡检读 取失败,将会显示失败原因。 设置巡检读取模式 注: 在 HBA 模式下运行的 PERC 硬件控制器上不支持该任务。 巡检读取会识别磁盘错误以避免磁盘故障、数据丢失或损坏。设置巡检读取任务仅适用于用作虚拟磁盘或热备盘的磁盘。 设置巡检读取任务将在后台运行并纠正磁盘错误(如果可能)。当设置巡检读取模式设置为 Auto(自动)时,当控制器在闲置特定 时间段以及没有其他后台任务都处于活动状态的情况下巡检读取会启动。在这种情况下,巡检读取可增强系统性能,因为当磁盘上 没有输入/输出活动的时磁盘错误可以识别并纠正。 控制器根据与巡检读取任务争用的控制器活动量调整专门用于巡检读取的系统资源数量。当控制器活动高时,较少的系统资源执行 巡检读取任务。 巡检读取不会在处于以下情况的物理磁盘上运行: ● 物理磁盘没有包括在虚拟磁盘中或分配为热备份。 ● 物理磁盘包括在目前处于以下操作的虚拟磁盘中: ○ ○ ○ ○ 重建 重新配置或重新构建
一致性检查报告 一致性检查报告提供有关按时间顺序在控制器上执行的一致性检查的信息。它提供诸如上次运行时间和结果的信息。如果一致性检 查失败,将会提供故障原因。 执行一致性检查 一致性检查任务可以验证冗余(奇偶校验)信息的准确性。此任务仅适用于冗余虚拟磁盘。如果需要,一致性检查任务可重建冗余 数据。当虚拟磁盘处于“失败的冗余”状态时,执行一致性检查可能让虚拟磁盘返回到就绪状态。 使用 OMSA 执行检查一致性 下面的链接提供关于如何使用 OpenManage Server Administrator (OMSA) 执行一致性检查的信息: http://www.dell.
● 您正在尝试重建到一个太小的热备用上 — 不同控制器对于热备用有不同的大小要求。 ● 已从虚拟磁盘中取消分配热备用 — 如果热备用已分配给多个虚拟磁盘并正用于为另一个虚拟磁盘重建故障物理磁盘,在某些控 制器上可能会发生此情况。 ● 虚拟磁盘包括故障或损坏的物理磁盘 — 此情况可能会生成警报 2083。有关警报消息的信息,请参阅 Dell.com/support/home 上的 Server Administrator Messages Reference Guide(服务器管理员消息参考指南)。 ● 重建率设置太低 — 如果重建率设置很低并且系统正在处理大量操作,则重建需要花异常长的时间完成。 ● 重建已取消 — 另一个用户可以取消您已经启动的重建。 虚拟磁盘重建完成但出现错误 关于此任务 包含冗余(奇偶)信息的磁盘部分损坏时,重建完成但出现错误。重建过程可以从磁盘的正常部分(而不是损坏部分)恢复数据。 当重建能够恢复除磁盘受损部分的数据以外的所有数据时,其指示成功完成,同时生成警报 2163。 有关系统固件和代理(用于监测 系统组件)生成的事件和错误消息的信息,请参阅“查找错误代码”,网址:qrl.
4. 从备份还原数据。 无论 Linux 操作系统是否将虚拟磁盘大小限制为 1 TB,虚拟磁盘大小都取决于操作系统的版本,以及用户实施的任何更新或修 改。有关操作系统的更多信息,请参阅操作系统说明文件。 为冗余和非冗余虚拟磁盘使用相同物理磁盘的相关问题 创建虚拟磁盘时,应避免为冗余和非冗余虚拟磁盘使用相同物理磁盘。这适用于所有控制器。为冗余和非冗余虚拟磁盘使用相同物 理磁盘可能会导致意外行为,包括数据丢失。 注: SAS 控制器不允许在同一组物理磁盘上创建冗余和非冗余虚拟磁盘。 启用 PERC 5/E 适配器上的警报以在出现物理磁盘故障时进行提醒 PERC 5/E 适配器使用可听警报来提醒关键的警告事件,包括虚拟磁盘或物理磁盘。您可以使用 BIOS 配置公用程序以启用或禁用机 载警报音。 关于此任务 要启用 BIOS 配置公用程序中的警报: 步骤 1. 按 Ctrl+N 以访问 Ctrl Mgmt 菜单屏幕。 2. 在 Settings(设置)方框中按 Tab 以将光标移动至 Enable Alarm(启用警报)。 3.
http://www.dell.com/support/home/drivers/DriversDetails?productCode=poweredge-vrtx&driverId=THVJ9 SPERC 驱动程序: http://www.dell.com/support/home/drivers/DriversDetails?productCode=poweredge-vrtx&driverId=120MK 重新配置 RAID 级别和虚拟磁盘 通过扩展容量和/或更改 RAID 级别的方式可重新配置联机虚拟磁盘。有关更多信息,请转至更改 PowerEdge 服务器上的 RAID 级 别。 丢失共享存储的访问权限 问题:丢失共享存储的访问权限。 纠正行动:将系统的驱动程序和固件更新到新版本。更新的顺序应为: ● ● ● ● ● ● ● ● ● CMC iDRAC/LCC BIOS PERC SPERC VRTX 主板 NIC 驱动程序 NIC 固件 交换机固件 以下链接包含适用于 VRTX 的系统驱动程序和固件: VRTX 机箱基础架构固件套件:http://www.dell.
如果操作系统引导成功,再次重新引导应导致不显示任何消息。 ● 清除控制器高速缓存 ○ ○ ○ ○ ○ ○ Ctrl + M 适用于 SCSI 控制器(PERC 3、PERC 4)。 Ctrl + R 适用于 SAS/SATA 控制器(PERC 5、PERC 6 和较新控制器)。 等待 5 分钟,以允许清除高速缓存内容。 重新引导到控制器 BIOS。 如果降低错误,引导至操作系统。 如果操作系统引导仍然不成功和/或错误仍然存在,这可能表示操作系统出现问题。与技术支持部门联系以获得进一步的故障 排除步骤。 ● 检查物理 PERC 控制器。 1. 检查 DIMM 和 DIMM 插槽是否有任何损坏。 2. 3. 4. 5. a. 请关闭系统并从系统卸下电源缆线。 b. 让系统静置 30 秒,以允许释放任何剩余的弱电。 c. 卸下 PERC 控制器。有关卸下和装回此系统中的部件的信息,请参阅用户指南,网址:www.dell.com/ poweredgemanuals。 d. 卸下 RAID 内存电池。确保插入 DIMM 后重新安装内存电池。 e. 从内存 DIMM 卸下控制器(如果适用)。 f.
● 高速缓存使用 硬件 RAID 控制器使用高速缓存(临时的信息存储库)才能正常操作。正常操作高速缓存包含 DRAM 内存(类似于系统内存)仅 在接通电源时保持数据。 较新的控制器利用 NVCache,这在服务器已关机时使用。NVCache 内存包含 DRAM 内存(用于正常操作)和闪存(非易失 性)。控制器电池(如果可操作)在断电期间为 DRAM 内存供电,以便内容可以复制到闪存以用于无限存储。 高速缓存的内容实质上可以分为三部分: ● RAID 配置和元数据 — RAID 阵列的信息,包括配置信息、磁盘成员、磁盘角色等。 ● 控制器日志 — RAID 控制器保持几个日志文件。戴尔技术人员依靠 TTY 日志作为主日志,用于故障排除各种 RAID 和硬盘驱动器 问题。 ● RAID 数据 — 这是要写入单独的硬盘驱动器的实际数据。数据会写入直写和回写高速缓存策略模式下的控制器的高速缓存。 分片 跨同一组磁盘配置多个 RAID 阵列称为分片。 RAID 划伤 RAID 划伤是 Dell PowerEdge RAID 控制器 (PERC) 功能,旨在允许控制器还原阵列冗余性,无论是否因双冗余条件导致数据丢失。
● 在包含非重要数据的条带中,例如 README.
避免问题发生以及在发生划伤后予以解决 Dell RAID 控制器包含多种功能,可防止许多类型的问题并处理多种错误。RAID 控制器的主要作业是保持阵列上所包含的数据的完整 性。即使在更极端的损坏情况下(例如划伤),阵列的数据通常可用并且服务器可以保留在生产中。任何维护计划的一部分都应为 RAID 阵列的主动式维护。Dell RAID 控制器高度可靠且无需用户干预即可管理其阵列。忽略此正常的维护,即使最精密的技术也会在 一段时间后遇到问题。需要执行一系列工作来帮助保护阵列正常运行,并避免大多数数据错误、双故障和划伤。 我们强烈建议执行例行程序和定期维护。主动式维护可纠正现有错误,并防止某些错误。它无法防止所有错误发生,但通过主动式 维护可降低显著最严重的错误。对于存储和 RAID 子系统,步骤如下: ● ● ● ● 更新控制器、硬盘驱动器、底板和其他设备上的驱动程序和固件。 执行例行程序一致性检查操作(戴尔建议每 30 天)。 检查电缆的磨损和损坏并确保连接良好。 查看日志以了解问题的说明。 这不是高级技术审查,只是粗略查看日志,以了解潜在问题的明显说明。如有任何问题或顾虑,请联系戴尔技术支持。 故障排除散
Recommended action for Windows Server 2019 3. 在所有群集节点上,使用注册表路径“HKEY_LOCAL_MACHINE\SYSTEM\ CurrentControlSet\Control\StorPort\QoSFlags”中的 值“0x1”创建注册表项 (Reg_DWORD)。重新启动所有群集节点以启用设置。 后续步骤 在上述启用后,按计划继续。如果问题仍然存在,请联系 Dell EMC 全球技术支持以获取进一步帮助。 82 硬件问题故障排除
5 服务器管理软件问题 此部分可帮助管理与服务器管理相关的软件问题。 主题: • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • 什么是不同类型的 iDRAC 许可证 如何激活 iDRAC 上的许可证 是否可以将 iDRAC 许可证从 Express 升级到 Enterprise 或 从 BMC 升级到 Express 如何找出缺失的许可证 如何使用 iDRAC Web 界面导出许可证 如何设置电子邮件警报 系统时区未同步 如何设置自动专用 NIC 功能 如何使用 Lifecycle Controller 配置网络设置 使用 OMSA 分配热备盘 存储设备运行状况 如何使用操作系统部署向导配置 RAID 物理磁盘上的外部驱动程序 物理磁盘报告为外部 如何在第 13 代 PowerEdge 服务器上更新 BIOS 为什么无法更新固件 Dell EMC PowerEdge 服务器上支持的操作系统 无法创建分区或找到分区并且无法安装 Microsoft Windows Server 2012 iDRAC 中的 JAVA 支持 如何指定语言
有关 iDRAC 许可功能的更多信息,请参阅 En.community.dell.com/techcenter/extras/m/white_papers/20067892 如何激活 iDRAC 上的许可证 您可以通过创建您的帐户来管理您的许可证并访问许可证管理门户。它可让您查看数字许可证、获取更换许可证,或将许可证重新 分配到不同硬件。 要创建帐户,请执行以下操作: ● ● ● ● ● 请转至 www.dell.
● 要将许可证直接下载到您的计算机,请选择 Download(下载),然后单击 Submit(提交)。如果想要通过电子邮件获得许可 证密钥,则选择 Email(电子邮件)。 有关 iDRAC 许可功能的更多信息,请参阅 En.community.dell.
如何设置自动专用 NIC 功能 Auto Dedicated NIC(自动专用 NIC)功能可提供选项,以在连接急救车或重新配置网络电缆等情况下,自动重新路由 iDRAC 管理 流量。启用此功能后,iDRAC 会自动和动态检测系统的网络模式。其感知系统的网络电缆连接配置,并检查电缆是否连接到了系统 的专用 NIC 端口。 此功能在 iDRAC7 上提供,从固件版本 1.30.
7. 单击 Enabled(已启用),然后在 Lifecycle Controller VLAN Settings(Lifecycle Controller VLAN 设置)下键入 VLAN ID 和 Priority(优先级)。 您不能配置以下 NIC 的 VLAN 设置: ● ● ● ● ● ● ● ● ● ● Emulex SeaHawk-2 (FH) PCIe 适配器 Emulex SeaHawk-2 (LP) PCIe 适配器 Emulex Vindicator-2 rNDC Emulex Sea Stallion-2 夹层卡 Emulex Pave Low-2 bNDC Emulex SeaHawk-2 (FH) NIC 仅 PCIe 适配器 Emulex SeaHawk-2 (LP) NIC 仅 PCIe 适配器 Emulex Vindicator-2 仅 NIC rNDC Emulex Sea Stallion-2 NIC 仅夹层卡 Emulex Pave Low-2 仅 NIC bNDC 8.
● 选择控制器并调查更低级别组件的状态。有关更多信息,请参阅存储组件严重性部分。 ● 单击处于降级状态的虚拟磁盘以显示物理磁盘属性页。 注: 只有属于虚拟磁盘一部分的物理磁盘处于警告或严重状态时,才会显示虚拟磁盘链接。 有关更低级别组件的状态如何上滚至针对控制器显示的状态中的更多信息,请参阅确定存储组件的运行状况部分。 如何使用操作系统部署向导配置 RAID 您可以在 Dell Lifecycle controller 上使用操作系统部署向导配置 RAID。要配置 RAID,请执行以下操作: ● ● ● ● ● 启动 Lifecycle Controller。 在左侧窗格中,单击 OS Deployment(操作系统部署)。 在操作系统部署页面上,单击部署操作系统。 在 Deploy OS(部署操作系统)页面中,单击 Configure RAID First(首先配置 RAID),然后单击 Next(下一步)。 可用于配置的存储控制器显示在 RAID 配置页面中。 注: 确保所选控制器不处于非 RAID 模式。 ● 选择存储控制器。将显示 RAID 配置选项。 ● 按照屏幕上的说明完成 RAID 设置任
物理磁盘报告为外部 本主题介绍了属于 RAID 阵列的一部分的磁盘可能会报告为外部的情况。 物理磁盘的状态可能会显示为 Foreign(外部),如果 ● 磁盘位于阵列以外一段时间 ● 磁盘从阵列移除和重置 要在卷中包括 Foreign(外部)磁盘,您可以清除外部配置和重置控制器配置。 清除外部配置 步骤 1. 在 iDRAC 9 Web 界面上,转至 Configuration(配置) > Storage Configuration(存储配置) > Controller Configuration(控 制器配置)。 此时会显示 Controller Configuration(控制器配置)页面。 2. 在 Foreign Configuration(外部配置)部分,从 Controller(控制器)下拉菜单中选择要为其清除外部配置的控制器。 3. 在 Apply Operation Mode(应用操作模式)下拉菜单中,选择要清除配置的时间。 重置存储控制器配置 步骤 1.
● 确保固件与系统或要更新的组件兼容。 ● 阅读固件的版本说明(如果可用),以查看任何特殊说明或兼容性信息。 ● 重新引导系统,然后重试更新。 Dell EMC PowerEdge 服务器上支持的操作系统 Dell EMC PowerEdge 服务器设计为与许多操作系统和虚拟化配合使用,可能包括但不限于: 1. 2. 3. 4. 5. 6. Canonical Ubuntu LTS Citrix XenServer 带 Hyper-V 的 Microsoft Windows Server Red Hat Enterprise Linux SUSE Linux Enterprise Server VMWare ESXi 有关特定的 PowerEdge 服务器上支持的操作系统的信息,请参阅 www.dell.
如何指定语言和键盘类型 要使用 Lifecycle Controller 指定语言和键盘类型: ● ● ● ● ● ● 启动 Lifecycle Controller。 在左侧窗格中,单击设置。 在 Settings(设置)窗格中,单击 Language and Keyboard(语言和键盘)。 从 Language(语言)下拉菜单中,选择语言。 从键盘类型下拉菜单中,选择键盘类型。 单击 Finish(完成)保存新设置。 消息事件 ID - 2405 说明 物理磁盘上的命令超时。 严重级别:警告 原因:降速物理磁盘需要比超时时间段更多的时间并且配置命令超时。 措施:检查磁盘驱动程序已存在或需要更换。如果是控制器导致超时,驱动器不可能会由于硬件本身故障而发生故障,但可能由通 信故障导致。更新服务器,然后成功重建驱动器以确认不是驱动器本身的问题。 在 Microsoft Windows 操作系统上安装管理系统软件 在 Microsoft Windows 中,插入 Dell EMC OpenManage Systems Management Tools and Documentation 软件时,会显示自动
在 VMware ESXi 上安装 Systems Management 软件 VMware ESXi 在出厂时即已安装在某些系统上。有关这些系统的列表,请参阅系统软件支持值表。 Server Administrator 以 .zip 文件,以安装在运行 VMware ESXi 的系统上。zip 文件 OM-SrvAdmin-Dell-Web-.VIB-ESXi_.zip(其中 <版本> 是受支持的 ESXi 版本。 从 vmware.
步骤 1. 启动 OpenManage Essentials。 2. 单击 Manage(管理) --> Discovery and Inventory(查找和资源清册)。 3. 在左侧面板上,单击 Add Discovery Range(添加查找范围)。 4. 输入特定客户端设备的 IP 地址或 IP 范围,具有所有客户端设备的子网掩码的详细信息。 5. 单击 Next(下一步)。 6. 在 ICMP Configuration(ICMP 配置)页面,单击 Next(下一步)。 7. 协议选择 从 Dell Command | Monitor 9.
6 操系统问题故障排除 本节帮助您诊断系统中的操作系统问题。 注: 如果问题仍然存在,请联系 Dell 技术支持部门以获取进一步帮助。 主题: • • • • • • • • • • • • 如何在戴尔 PowerEdge 服务器上安装操作系统 查找 VMware 和 Windows 许可 蓝屏错误或 BSOD 故障排除 紫屏死机或 PSOD 故障排除 Windows 操作系统无引导问题故障处理 iDRAC 中没有 POST 问题 故障排除无 POST 情况 使用 Dell Migration Suite for SharePoint 迁移至 OneDrive for Business Windows VMware Linux 通过多种方法安装操作系统 如何在戴尔 PowerEdge 服务器上安装操作系统 问题:使用 Lifecycle Controller 在戴尔 PowerEdge 服务器上安装操作系统。 解决方案:以下链接可提供关于使用 Lifecycle Controller 安装操作系统的详细原则:http://www.dell.
图 25: 蓝屏死机 2. 运行 PSA/ePSA 诊断程序。有关更多信息,请参阅 PSA/ePSA 诊断程序 页面上的 18。 3. 如果诊断通过但问题仍然存在,识别蓝屏错误发生的阶段。 4. 如果在引导过程中发生出现蓝屏死机,请检查最低 POST 组件。有关更多信息,请参阅 故障排除无 POST 情况 页面上的 97。 如果问题仍然存在,请联系戴尔技术支持。 5. 如果预登录过程中出现出现蓝屏死机,引导到安全模式并禁用所有启动条目。一次隔离一个启动条目,直至找到导致问题的代 理。 注: 如果您无法引导到安全模式,请致电戴尔技术支持。 6. 如果问题仍然存在,请检查最低 POST 组件。有关更多信息,请参阅无 POST。 如果问题仍然存在,请联系戴尔技术支持。 7.
注: 有关更多故障处理步骤,请参阅 https://support.microsoft.com/en-us/kb/325375。 4. 在安全模式或 DSRM 下,使用 msconfig 实用程序禁用启动应用程序或服务器上的非 Microsoft 服务。 5. 在正常模式下重新引导服务器。 6. 如果服务器开始引导,则依次启用服务和启动应用程序并重新引导服务器直到服务器引导失败,以使用 msconfig 实用程序识别 中断的服务或应用程序。 7.
允许服务器完全引导至操作系统或关闭服务器电源,然后再设置到第一个引导设备的 vFlash 分区。这使该服务器能够引导至 vFlash 分区并且错误将不再可见。 重新引导期间在 POST 时显示“Alert! iDRAC6 not responding.Power required may exceed PSU wattage...”错误消息。 说明 重新引导期间在 POST 时显示一条错误消息“Alert! iDRAC6 not responding.Power required may exceed PSU wattage.Alert! Continuing system boot accepts risk that system may power without warning.Strike the F1 key to continue, F2 to run the system setup program”。 分辨率 请执行下列步骤: 1. 重新引导服务器以解决问题。 2. 卸下交流电源后等待 30 秒。交流电源重新接通后,等待两分钟以允许 iDRAc 完成 POST 或初始化。 3.
a. 如果服务器完成 POST,则关闭服务器并且每次安装一个组件,直至找到故障的组件。 如果识别到缺陷部件,请联系戴尔技术支持并提供缺陷部件的信息。 b. 如果无法确定缺陷部件,请转至下一步。 8. 从服务器再次断开连接硬盘驱动器、光盘驱动器和磁带机并尝试对服务器执行 POST。 a. 如果服务器完成 POST,每次装回一个硬盘驱动器,直至找到有故障的硬盘驱动器。 如果识别到缺陷部件,请联系戴尔技术支持并提供缺陷部件的信息。 b. 如果无法确定缺陷部件,请转至下一步。 9. 重置控制面板连接器。 10. 确保已正确安装处理器和散热器。 11. 如果服务器未完成 POST,则使用跳线清除 NVRAM。 有关更多信息,请查阅系统的用户手册,网址:www.dell.com/poweredgemanuals。 后续步骤 如果问题仍然存在,请联系戴尔技术支持以获取帮助。 使用 Dell Migration Suite for SharePoint 迁移至 OneDrive for Business 关于此任务 要连接到 OneDrive for Business: 步骤 1.
步骤 1. 将键盘、显示器、鼠标和所有其它外围设备连接至系统。 2. 打开系统和已连接的外围设备。 3. 如果您要配置硬件、诊断程序或设置更改,请在 LifeCycle Controller 窗口中单击相应选项。 如果无需任何更改,请选择 OS Deployment(操作系统部署)。 4. 在 Operating System Deployment(操作系统部署)窗口中,单击 Deploy OS(部署操作系统)。 屏幕上将显示 Configure or Skip RAID(配置或跳过 RAID)窗口。如果已配置独立磁盘冗余阵列 (RAID),窗口中将显示现有的 RAID 配置详情。 5. 选择 Go directly to OS Deployment(直接进入操作系统部署)。 如果尚未配置 RAID,则应 6. 单击 Next(下一步)。 随即显示 Select Operating System(选择操作系统)窗口,其中包含兼容操作系统的列表。 7. 选择 ,然后单击 Next(下一步)。 注: 如果未列出 8. 选择是否要在 UEFI 或 BIOS 模式下部署操作系统,然后单击 Next(下一步)。 9.
使用操作系统介质安装 Windows Server 关于此任务 要安装 Standard、Datacenter、 和 Essentials 版本的 Microsoft Windows Server 操作系统: 步骤 1. 将键盘、显示器、鼠标和任何附加外围设备连接至系统。 2. 打开系统和所有连接的外围设备。 在启动期间,将显示多个 BIOS 屏幕,但不需要用户进行任何干预。 注: BIOS 和 UEFI 模式支持这种安装方法。 3. 将 Microsoft Windows Server 介质插入 DVD 驱动器。 屏幕上将显示以下信息: Loading Files 注: 如果系统上已安装 Windows 操作系统,以下信息将出现: Press any key to boot from the CD/DVD ... Press any key to begin the installation 4. 加载文件后,单击您要部署的相应语言。 注: 此屏幕对简体中文或繁体中文操作系统不予显示。 5.
后续步骤 操作系统安装完毕。 注: 登录到系统后,您可使用 Server Manager Dashboard(服务器管理器控制板)配置和管理操作系统中的不同角色和功能。 常见问题 如何解决戴尔第 12 代服务器的设备管理器中的黄色感叹号? 说明 在戴尔 PowerEdge 第 12 代服务器上安装 Windows Server 2012 R2 后,在设备管理器中的“Hidden Devices: PCI SIMPLE COMMUNICATIONS CONTROLLER”(隐藏设备:PCI 简单通信控制器)下会出现两个黄色感叹号。这些设备不会影响服务器的功 能。 分辨率 从 www.dell.com/support 下载并安装相应服务器的芯片组驱动程序。 为什么在 Windows Server 2008 R2 SP1 安装过程中无法检测到 USB 键盘和鼠标 原因 此问题是因为 Windows Server 2008 R2 SP1 不支持本地 USB 3.0 驱动程序。 分辨率 1. 在“系统设置”中,确保“集成设备设置”屏幕上的 USB 3.
为何在 PowerEdge 服务器上使用 Lifecycle Controller 安装 Windows OS 有时失败 并显示错误消息 原因 当驱动程序的大小超过通过操作系统提供临时存储空间时会发生此问题。 分辨率: 在安装操作系统之前,请确保没有在系统上安装附加设备。为避免手动卸下硬件,您还可以在 BIOS 配置实用程序中禁用 PCIe 插 槽。 为什么 Windows Server 2008 R2 SP1 安装后在 UEFI 模式下显示空白屏幕 在 UEFI 模式下使用 Lifecycle Controller (LC) 或手动方式安装 Windows Server 2008 R2 SP1 后,在引导至 OS 时显示空白屏幕。 原因 此问题发生的原因是 Windows Server 2008 R2 不支持图形输出协议 (GOP)。 分辨率 在 BIOS 配置实用程序中,确保 Miscellaneous Settings(其他设置)屏幕上的 Load Legacy Option Rom(加载传统选项 ROM)设置为 Enable(启用)。 重新启动系统并再次引导至操作系统。 症状 引导至 iSC
7. 由于内存 (RAM) 损坏,出现 cng.sys STOP 错误。 要解决此问题,请执行以下操作: 1. 2. 3. 4. 5. 确保系统更新为 cng.
2. 选择 System Bios(系统 BIOS)选项,然后选择 Integrated Devices(集成设备)。 3. 返回 System Bios Menu(系统 BIOS 菜单),然后选择 Boot Settings(引导设置)。 4. 确保 Boot Mode(引导模式)是 Bios mode(BIOS 模式),然后单击 BIOS Boot Settings(BIOS 引导设置)。 5. 在 BIOS Boot Settings(BIOS 引导设置)中,选择 Boot Sequence(引导顺序)并确保 Hard Drive C:(硬盘 C:)位于顶部。 6. 在 Hard-Disk Drive Sequence(硬盘驱动器顺序)中,将 Internal SD:IDSDM(内部 SD:IDSDM)移动到集成 RAID 控制器上 方。 7. 引导至 Hyper-V Server 2012 R 2 ISO,然后单击 Install Now(立即安装)。 8. 勾选方框以接受许可证条款,然后单击 Next(下一步)。 9. 选择自定义:仅安装 Hyper-V Server 的较新版本(高级)。 10.
无法将存储空间分配到虚拟机 使用虚拟机的优势之一是,您可以动态向虚拟机分配驱动器空间以满足存储要求。它有助于优化空间利用率。 如果虚拟机关联的硬盘驱动器没有足够的可用空间,您可能无法将空间分配到虚拟机。尝试向虚拟机分配空间之前,确保硬盘驱动 器有足够的可用空间。 配置备份和还原的步骤 Dell EMC 建议您在适用于您的数据中心环境的例行程序计划中完成初始设置后备份您的 VMware ESXi 配置。备份配置可捕获许可证 代码(主机序列号)。 要备份或还原配置信息,请使用 VMware vSphere CLI。vSphere CLI 在以下配置中提供: ● vSphere CLI 软件包 — vSphere CLI 软件包可安装在 Linux 或 Microsoft Windows 操作系统上。 ● vSphere Management Assistant (vMA) — vMA 可部署在 ESXi 主机上。 两者均可从 vmware.
4. 运行 vicfg-cfgbackup 命令和 –l 标记以将备份文件加载和还原到主机。 vicfg-cfgbackup --server -- portnumber --protocol -- username --password -l -portnumber 和 -protocol 选项为可选。如果您排除它们,则默认值是 port 443 和协议 HTTPS。 注: 如果您不指定密码中的命令行,系统会在执行命令时提示您输入一个。例如:vicfgcfgbackup --server 172.17.13.211 --username root –l backupdate.
症状 将静态 IPv6 地址分配给启动程序时,无法从 iSCSI 引导 说明 将静态 IPv6 地址分配给启动程序时,成功安装后,SUSE Linux Enterprise Server 12 无法从 IPv6 地址上的 iSCSI 引导。 分辨率 使用启动程序的“动态主机配置协议 (DHCP)”地址。 通过多种方法安装操作系统 通过 Dell Lifecycle Controller 和各种方法安装和部署操作系统,请观看下面列出的视频: 表. 22: 通过 LC 和多种方法安装操作系统 Slno 视频说明 位置 1. 启动 Lifecycle Controller 启动 LC 2. Dell Lifecycle Controller - 固件回滚 LC 固件回滚 3. Dell Lifecycle Controller - 使用 FTP 服务器更新固件 使用 FTP 服务器更新固件 4. Dell Lifecycle Controller - 使用网络共享更新固件: CIFS(通用 Internet 文件系统) LC - 使用 CIFS 更新固件 5.
表. 22: 通过 LC 和多种方法安装操作系统 (续) Slno 视频说明 位置 21. 无人值守操作系统安装,UEFI 模式 无人值守操作系统安装 UEFI 模式 22. 无人值守操作系统安装,BIOS 模式 无人值守操作系统安装 BIOS 模式 23. 重新利用或淘汰系统 重新利用或淘汰系统 24. 在 USB 驱动器中收集技术支持报告和导出 在 USB 驱动器中收集技术支持报告和导出 25. 使用 Lifecycle Controller 部署操作系统 – 手动安装方 使用 LC 部署操作系统 – 手动安装方法 法 26.
7 获取帮助 主题: • • • 联系 Dell EMC 下载驱动程序和固件 找到您的系统服务标签 联系 Dell EMC Dell EMC 提供了几种联机以及电话支持和服务选项。如果没有可用的互联网连接,可在购货发票、装箱单、帐单或 Dell EMC 产品目 录上查找联系信息。具体的服务随您所在国家/地区以及产品的不同而不同,某些服务在您所在的地区可能不提供。要就销售、技术 帮助或客户服务问题联系 Dell EMC: 步骤 1. 转至 www.dell.com/support/home。 2. 从页面右下角的下拉菜单中选择您所在的国家/地区。 3. 对于定制的支持: a. 在 Enter your Service Tag(输入您的服务标签)字段中,输入您的系统服务标签。 b. 单击 Submit(提交)。 此时将显示其中列出各种支持类别的支持页面。 4. 对于一般支持: a. 选择您的产品类别。 b. 选择您的产品分类。 c. 选择您的产品。 将显示支持页面,其中列出各种支持类别。 5. 有关联系 Dell EMC 全球技术支持的详细信息: a. 单击 全局技术支持。 b.
找到您的系统服务标签 通过唯一的快速服务代码和服务标签号识别您的系统。通过拉出信息标签,可以在系统正面找到快速服务代码和服务标签。或者,信 息可能在系统机箱上的不干胶 标签 上。小型企业服务 标签 ( EST )在系统背面找到。此信息由 Dell 用于将支持呼叫转接给合适的人 员。 图 26: 找到您的系统服务标签 1. 信息标签(俯视图) 3. Open Manage Mobile (OMM) 标签 5. 服务标签 110 获取帮助 2. 信息标签(后视图) 4.