适用于 Microsoft System Center Virtual Machine Manager 的 Dell Server PRO Management Pack 3.0.
注、小心和警告 注: “注”表示可以帮助您更好地使用计算机的重要信息。 小心: “小心”表示可能会损坏硬件或导致数据丢失,并说明如何避免此类问题。 警告: “警告”表示可能会造成财产损失、人身伤害甚至死亡。 © 2013 Dell Inc. 保留所有权利。 本文中使用的商标: Dell™、Dell 徽标、Dell Boomi™、Dell Precision™、 OptiPlex™、Latitude™、PowerEdge™、PowerVault™、 PowerConnect™、OpenManage™、EqualLogic™、Compellent™、KACE™、FlexAddress™、Force10™、Venue™ 和 Vostro™ 是 Dell Inc. 的 商标。Intel®、Pentium®、Xeon®、Core® 和 Celeron® 是 Intel Corporation 在美国和其他国家或地区的注册商标。 AMD® 和 AMD Opteron™、AMD Phenom™ 以及 AMD Sempron™ 是 Advanced Micro Devices, Inc.
目录 1 简介...............................................................................................................................................4 此发行版中的新功能..............................................................................................................................................4 概述.......................................................................................................................................................................... 4 有关术语............................
简介 1 本文档面向的读者为系统管理员,即通常使用 Dell Server PRO Management Pack (Dell PRO Pack) 监测 Dell 系统并 在发现低效系统时采取补救操作的管理员。 Dell PRO Pack 3.0.
测驱动器错误),通过利用 Operations Manager 的监测和警报功能以及 VMM 的补救功能来提出相应的补救措 施。 另请参阅: 特点和功能 了解 PRO Tip 管理 警报和恢复操作 有关术语 • 管理系统 是运行 Dell OpenManage Server Administrator (OMSA) 的 Dell 系统,该系统通过 Operations Manager 和 VMM 进行监测和管理。可以通过受支持的工具从本地或远程进行管理。 • 管理工作站或管理站 是基于 Microsoft Windows 且安装有 Operations Manager 和 VMM 来管理虚拟化工作负 载的 Dell 系统。 PRO Tip 是什么 PRO(性能和资源优化)Tip 功能可以监测虚拟基础结构,并在有机会优化资源利用时发出警报。PRO Tip 窗口 包含生成 PRO Tip 的事件说明,和建议的补救操作。此功能允许用户在达到指定的阈值时,在物理主机间进行 VM 负载平衡。或者,可以在检测到硬件故障时迁移 VM。 VMM Administrator 控制台中的 PRO Tip 窗口让用户可以
图 1: 组件交互 在此图中,一组 PowerEdge 系统用作管理系统,两个 PowerEdge 系统用作托管 Operations Manager 和 VMM 的 管理站。在转变成非正常状态时,OMSA 会生成具有相应严重级别的警报。Dell PRO Pack 监测 PRO 的相同警 报。Dell PRO Pack 将 OMSA 警报与其补救操作相匹配。 下表说明在 PRO Tip 管理中出现的事件顺序。 顺序号 事件 1 启用主机上的 Operations Manager 代理程序,以检测 OMSA 生成的警报、错误或故障警 报。 2 警报会发送至 Operations Manager。 3 Operations Manager 控制台显示当前的 PRO 警报。 4 Operations Manager 向 VMM 通知警报和关联的 PRO Tip ID。 5 VMM 在 PRO Tip 窗口中显示相应项和补救操作。 6 实施 PRO Tip,以便通过将管理系统置于限制模式或限制和迁移模式,能够在管理系统上 执行恢复操作。 7 VMM 向 Operations Manag
管理站: 有关 Operations Manager 和 VMM 的所支持配置的列表,请参阅以下内容: • Operations Manager 2012 R2 或 Operations Manager 2012 SP1 或 Operations Manager 2012 technet.microsoft.com/en-us/library/hh205990.aspx • Operations Manager 2007 R2 - technet.microsoft.com/en-us/library/bb309428.aspx • System Center 2012 R2 Virtual Machine Manager 或 System Center 2012 SP1 Virtual Machine Manager 或 System Center 2012 Virtual Machine Manager - technet.microsoft.com/en-us/library/gg610562.
使用 Dell Performance Resource Optimization Pack 2 本章提供使用 PRO Pack 的建议步骤。 为 PRO Tip 计划环境 您可以计划启用与环境相关的 PRO 监测器。默认情况下,所有的 PRO 监测器在 Dell PRO Pack 中已禁用。有关 警报和恢复操作的列表,请参阅警报和恢复操作。选择要启用的警报。使用 OpsMgr 创作控制台(或)OpsMgr 控制台中的创作窗格,为那些启用相关 PRO 监测器的管理包创建覆盖。 启用 PRO 监测器的步骤如下: 1. 启动 OpsMgr 控制台。 2. 在导航窗格中单击创作。 3. 在 Authoring(创作)选项卡中,选择 Management Pack Objects(管理包对象) → Monitors(监测器)。 4. 在屏幕顶部单击 Change Scope(更改范围)。 5. 选择 View all targets(查看所有目标)并在 Look for(寻找)中输入 Dell PRO。 6.
或者,如果在 PRO Tip 窗口中选择创建新 PRO Tip 时显示此窗口选项,此窗口会在 PRO Tip 生成时在 VMM 控制 台上自动打开。 PRO Tip 窗口以表格格式显示 PRO Tip 源、提示及状态等信息。此窗口还显示触发警报的问题描述、原因及建议 的恢复补救操作。 实施恢复操作 PRO Tip 窗口提供选项允许实施或解除建议的操作。如果选择 实施,VMM 则会根据警报性质执行以下某个恢复 任务。 将主机置于限制模式 将主机置于限制模式可防止在问题解决前将工作负载分配给主机。在此模式中,主机仍可接收有关 Operations Manager 和 VMM 上相关 PRO Tip 的警报。 可触发维护的系统运行情况属于虚拟主机上的非严重硬件警报,比如 Dell Power Edge 虚拟主机服务器上的机箱 环境温度警告。 虚拟机的迁移 PRO Tip Management Pack 采用 VMM 算法将 VM 从问题系统移到正常系统。有关 VMM 算法的更多信息,请参 阅 Microsoft 说明文件,位于 technet.microsoft.
如果主机组或主机群集中没有正常主机可用,PRO Tip 移动 VM 操作将会失败。在这种情况下,PRO Tip 窗口会 显示相应 PRO Tip 的状态为失败,并在错误部分详细说明原因。VMM 控制台上作业部分相应项的状态也会显示 为失败。 注: 在 PRO Tip 窗口中,失败消息会动态更新。不过要刷新数据,必须单击 PRO Tip 窗口之外,然后再次 单击以使窗口得到焦点。 如果选择解除,则不执行 PRO Tip 并且会发生以下更改: • PRO Tip 从 SCVMM PRO Tip 控制台中被移除。 • Operations Manager 中的警报从 Dell Server PRO 警报中被移除。 有关更多信息,请参阅使用 Health Explorer 重设警报。 VM 实时迁移 作为连接的用户,在实时迁移期间,用户可以将 VM 从 Windows Server 2008 R2 故障转移群集的一个节点迁移 到同一群集的另一个节点上,且无须停机时间或中断。 快速迁移和实时迁移的不同在于快速迁移需要停机时间,而实时迁移不需要停机时间。 注: Windows Server 2008 Hyper-
要访问警报视图,请执行以下操作: 1. 启动 Operations Manager 控制台。 2. 选择监测选项卡。 3. 在 Dell Server PRO Pack 中,选择 Dell Server PRO 警报。 警报显示在屏幕右侧,如下图中所示。 状态视图 以表格格式显示找到的 Dell 系统对象。状态视图显示对象的信息,包括:名称、路径、Dell 服务器存储运行状 况等等。可以通过定义想要显示的对象和数据的显示形式,来个性化状态视图。 使用 Health Explorer 重设警报 Health Explorer 使用户能够查看并针对警报采取行动。在 PRO Tip 窗口中选择解除时,也会从中移除警报。 要手动重设该警报,请执行以下操作: 1. 在操作菜单中,单击 Health Explorer。 2. 右键单击要关闭的警报。 3. 选择重设运行状况。警报从 PRO Tip 窗口中消失。 覆盖恢复操作 PRO Pack 3.0.
• 2:将服务器置于限制模式 通过更改默认的恢复操作标志值,可以覆盖默认的恢复操作。例如,使用 Operations Manager 控制台中提供的 覆盖选项,将恢复标志值由 2 更改为 1。将默认值覆盖为 1 并实施 PRO Tip 后,恢复操作会从主机触发 VM 的迁 移。如果您输入非 1 和 2 的任何其他值,PRO Tip 实施将失败并显示错误消息。 要覆盖恢复操作,请执行以下操作: 1. 单击 Operations Manager 中的撰写选项卡。 2. 浏览至撰写 → 管理包对象 → 监测器 3. 搜索 Dell PRO Pack 监测器。 4. 选择想要覆盖的监测器。 5. 右击并选择覆盖 → 覆盖恢复 → <监测器> 。 6. 选择覆盖复选框。 7. 更改覆盖值的值。 8. 注: 当选择启用时,Operations Manager 会自动实施设备监测器。因为此过程包括 VMM 迁移、查看和 设置相应的值。 选择强制选项。 9.
Dell 事件 ID VMM 中有关 Operations Manager 和 PRO Tip 的警报说 明 1053 温度传感器检测到警 警告 告值 背板、系统板、CPU 限制 或特定系统驱动器托 架上的温度传感器超 过警告阈值。 1054 温度传感器检测到故 Error(错误) 障值 背板、系统板、CPU 限制和迁移 或特定系统驱动器托 架上的温度传感器超 过故障阈值。 1104 风扇传感器检测到故 Error(错误) 障值 指定系统中的风扇传 限制 感器检测到一个或多 个风扇故障。 1154 电压传感器检测到故 Error(错误) 障值 特定系统中的电压传 限制和迁移 感器超过故障阈值。 1203 电流传感器检测到警 警告 告值 特定系统中的电流传 限制 感器超过警告阈值。 1204 电流传感器检测到故 Error(错误) 障值 特定系统中的电流传 限制和迁移 感器超过故障阈值。 1305 已降级冗余 警告 特定系统中电源传感 限制 器的读数超过警告阈 值。 1306 Redundancy lost(冗 余丢失) Error(错误) 电源设备已断开连
Dell 事件 ID VMM 中有关 Operations Manager 和 PRO Tip 的警报说 明 严重性 警报原因 2056 虚拟磁盘故障 严重 虚拟磁盘中包括的一 限制和迁移 个或多个物理磁盘已 发生故障。 2057 虚拟磁盘降级警告 警告 当冗余虚拟磁盘中的 限制 物理磁盘发生故障时 出现此警告消息。 2076 虚拟磁盘检查一致性 严重 失败 虚拟磁盘中的物理磁 限制和迁移 盘发生故障或奇偶校 验信息有错。 2082 虚拟磁盘重建故障 严重 虚拟磁盘中的物理磁 限制 盘发生故障或损坏。 2083 物理磁盘重建失败 严重 虚拟磁盘中的物理磁 限制 盘发生故障或损坏。 2094 预测故障报告 警告 预测物理磁盘将发生 限制 故障。 2100 温度超过最大警告阈 警告 值 物理磁盘机柜太热。 限制 有多种因素会导致过 热温度。 2101 温度低于最低警告阈 警告 值 物理磁盘机柜太冷。 限制 2102 温度超过最大故障阈 严重 值 物理磁盘机柜太热。 限制和迁移 有多种因素会导致过 热温度。 2103 温度低于最低故障阈 严重
Dell 事件 ID VMM 中有关 Operations Manager 和 PRO Tip 的警报说 明 2169 需要更换控制器电池 严重 控制器电池无法再充 限制和迁移 电。电池的再充电次 数可能已到达最大 值。另外,电池充电 器可能不工作。 2171 控制器电池温度超出 警告 正常值 室温可能太高。系统 限制 风扇可能降级或发生 故障。 2174 控制器电池已被移除 警告 控制器无法与电池进 限制和迁移 行通信。电池可能已 被移除或接触点降级 2178 控制器电池记忆周期 警告 超时 控制器电池在记忆周 限制 期开始之前必须完全 充满。 2187 超出控制器 DIMM 上 警告 的单位 ECC 错误限制 控制器内存出现故 障。 2201 全局热备用失败 警告 控制器无法与指定为 限制 全局热备用的磁盘进 行通信。磁盘发生故 障或被移除。 2203 专用热备用失败 警告 控制器无法与指定为 限制 专用热备用的磁盘进 行通信。 2206 唯一可用的热备用是 警告 SATA 磁盘。SATA 磁 盘无法更换 SAS 磁盘 仅有的可指定为热备 限制 用的物
Dell 事件 ID VMM 中有关 Operations Manager 和 PRO Tip 的警报说 明 严重性 警报原因 2268 Storage Management 通信错误 严重 Storage Management 限制和迁移 已失去与控制器的通 信。若控制器驱动程 序或固件遇到问题则 会发生此情况。 2272 巡检读取发现无法纠 严重 正的介质错误 巡检读取任务遇到无 限制和迁移 法纠正的错误。可能 存在无法重新映射的 坏磁盘块。 2273 控制器标记了物理磁 严重 盘上的块。 控制器在尝试读取物 限制和迁移 理磁盘上的块时遇到 了无法恢复的介质错 误并将该块标记为无 效。 2282 热备用 SMART 轮询 失败 警告 控制器固件尝试在热 限制和迁移 备用上进行 SMART 轮询,但是无法完 成。 2283 冗余路径中断 警告 控制器有两个连接器 限制和迁移 连接到同一个机柜 上。 2289 控制器 DIMM 上的多 严重 位 ECC 错误 在读取或写入操作时 限制和迁移 遇到多位错误。 2290 控制器 DIMM 上的单 警告 位 ECC
Dell 事件 ID VMM 中有关 Operations Manager 和 PRO Tip 的警报说 明 严重性 警报原因 Dell PRO Tip 建议操作 2302 机柜未响应 严重 机柜或机柜组件处于 限制和迁移 “失败”或“降级” 状态。 2306 坏块表格已达 80% 警告 坏块表格是用于重新 限制 映射坏磁盘块的表 格。重新映射坏磁盘 块时会相应填写此表 格。 2307 坏块表格已满。 严重 坏块表格是用于重新 限制 映射坏磁盘块的表 格。 2310 虚拟磁盘永久降级 严重 冗余虚拟磁盘已失去 限制和迁移 冗余。虚拟磁盘的多 个物理磁盘发生故障 时则会发生此情况。 2312 机柜的一个电源设备 警告 发生交流电源故障 电源设备发生交流电 限制 源故障 2313 机柜的一个电源设备 警告 发生直流电源故障 电源设备发生直流电 限制 源故障 2314 系统启动时,SAS 组 严重 件的初始化顺序发生 故障。无法进行 SAS 管理和监测。 Storage Management 无法监测或管理 SAS 设备。 2318 检测到电池或电池充
Dell 事件 ID VMM 中有关 Operations Manager 和 PRO Tip 的警报说 明 严重性 警报原因 Dell PRO Tip 建议操作 可能由于过热而弯 曲,无法正常工作。 2327 警告 NVRAM 有损坏的数 据。控制器正在重新 初始化 NVRAM 限制和迁移 NVRAM 有损坏的数 据。电源浪涌、电池 故障或其他原因可导 致此情况的发生。控 制器正在重新初始化 NVRAM 2328 NVRAM 有损坏的数 据 警告 限制和迁移 NVRAM 有损坏的数 据。控制器无法纠正 此情况 2329 SAS 端口报告 警告 此警报的文本由控制 限制和迁移 器生成并随情况而改 变。 2337 控制器无法从电池备 严重 用单元 (BBU) 恢复高 速缓存的数据 控制器无法从高速缓 限制 存恢复数据。 2340 后台初始化 (BGI) 完 严重 成,但出现不可纠正 的错误 后台初始化任务遇到 限制和迁移 不可纠正的错误。 2342 检查一致性时发现不 警告 一致的奇偶校验数 据。数据冗余可能丢 失 源磁盘上的数据和目 限制和迁移 标磁盘上的冗余数
Dell 事件 ID VMM 中有关 Operations Manager 和 PRO Tip 的警报说 明 2396 检查一致性检测到无 严重 法纠正的介质错误 物理驱动器中的介质 限制 错误: 2397 检查一致性完成,但 严重 有无法纠正的错误 物理驱动器中的介质 限制和迁移 错误: 2416 检测到磁盘介质错误 警告 检测到磁盘介质错误 限制 2417 在虚拟磁盘上检测到 严重 无法恢复的介质错误 在虚拟磁盘上检测到 限制和迁移 无法恢复的介质错 误。 2,4 驱动程序名 称: b06bdrv,ebdrv b57w2k,b57nd60x, b57nd60a,l2nd Dell OMNIC Broadcom 严重 网络接口链接关闭 网络链接关闭。 限制 链接已断开。 限制 13,27,29,70 驱动程 Dell OMNIC Intel 网络 接口链接关闭 序名称: e1express, e1qexpress, ixgbe, e1000 严重性 严重 警报原因 Dell PRO Tip 建议操作 19
相关文档和资源 3 本章提供帮助用户使用 Pro Pack 3.0.1 的文档和资源的详情。 安全注意事项 操作控制台访问特权由 Operations Manager 内部处理。您可以通过使用 Operations Manager 控制台上 Administration Security(管理安全)功能下的 User Roles(用户角色)来设置此特权。分配给您的角色配置文件 决定了您能够执行的具体操作以及您能管理的具体对象。有关安全注意事项的更多信息,请参阅有关 Microsoft System Center 2012 R2 Operations Manager、Microsoft System Center 2012 SP1 Operations Manager、Microsoft System Center 2012 Operations Manager、Microsoft System Center Operations Manager 2007 R2 的文档,或 Microsoft Systems Center Essentials 2010 在线帮助,具体位于:technet.