適用於 Microsoft System Center Virtual Machine Manager 的 Dell Server PRO Management Pack 3.
註、警示與警告 註: 「註」表示可以幫助您更有效地使用電腦的重要資訊。 警示: 「警示」表示有可能會損壞硬體或導致資料遺失,並告訴您如何避免發生此類問題。 警告: 「警告」表示有可能會導致財產損失、人身傷害甚至死亡。 © 2013 Dell Inc. 本文所用的商標:Dell™、Dell 徽標、Dell Boomi™、Dell Precision™、OptiPlex™、Latitude™、PowerEdge™、PowerVault™、 PowerConnect™、OpenManage™、EqualLogic™、Compellent™、KACE™、FlexAddress™、Force10™ 與 Vostro™ 為 Dell Inc. 的商標。 Intel®、Pentium®、Xeon®、Core® 與 Celeron® 為 Intel Corporation 在美國及其他國家/地區的註冊商標。AMD® 為 Advanced Micro Devices, Inc.
目錄 註、警示與警告........................................................................................................................... 2 1 簡介...............................................................................................................................................5 本版本有哪些新特色呢?......................................................................................................................................5 概觀..............................................................................
1 簡介 本文件適用於使用 Dell Server PRO Management Pack (Dell PRO Pack) 來監視 Dell 系統,並在發現系統不足時採取 補救動作的系統管理員。 Dell PRO Pack 3.
的託管虛擬機器 (VM)。Dell PRO Pack 會在監視的物件轉換為不良狀態 (例如,虛擬磁碟故障或預知的磁碟機錯 誤) 時,利用 Operations Manager 的監視和警示功能及 VMM 的補救功能,建議補救動作。 此外請參閱: 特色和功能 瞭解 PRO 提示管理 警示與復原動作 相關術語 • 受管系統是指執行 Dell OpenManage Server Administrator (OMSA) 的 Dell 系統,使用 Operations Manager 和 VMM 監督和管理,而且可以在本機管理或使用支援的工具從遠端管理。 • 管理站或 Management Station 是指已安裝 Operations Manager 和 SCVMM 來管理虛擬工作負載的 Microsoft Windows 型 Dell 系統。 什麼是 PRO 提示 PRO (效能和資源最佳化) 提示這項功能會監視虛擬基礎結構,並在有機會最佳化這些資源的使用情況時發出警 示。PRO Tip window (PRO 提示) 視窗包含產生 PRO 提示事件的說明,以及建議的補救動作。此功能可以在達到 特定臨界值時
圖 1.
管理站: 如需 Operations Manager 與 VMM 支援設定清單,請參閱: • Operations Manager 2012 或 Operations Manager 2012 SP1 - technet.microsoft.com/en-us/library/ hh205990.aspx • Operations Manager 2007 R2 - technet.microsoft.com/en-us/library/bb309428.aspx • System Center 2012 Virtual Machine Manager 或 System Center 2012 SP1 Virtual Machine Manager technet.microsoft.com/en-us/library/gg610562.
使用 Dell Performance Resource Optimization Pack 2 本章建議使用 PRO Pack 的步驟。 規劃 PRO 提示的環境 您可以規劃與環境相關的 PRO 監視。依據預設,所有 PRO 監視在 Dell PRO Pack 中皆為停用。如需有關警示與 復原動作的清單,請參閱警示與復原動作。選擇您要啟用的警示。使用 OpsMgr 主控台中的 OpsMgr Authoring Console (或) Authoring (製作) 窗格,建立一個管理套件以覆蓋原有的管理套件,以啟用相關的 PRO 監視。 啟用 PRO 監視的步驟如下: 1. 啟動 OpsMgr 主控台。 2. 在 Navigation (瀏覽) 窗格上,按一下 Authoring (製作)。 3. 在 Authoring (製作) 標籤中,選取 Management Pack Objects (管理組件物件) → Monitors (監視)。 4.
或者,如果您在 PRO Tip (PRO 提示) 視窗中選取 Show this window when new PRO Tips are created (建立新 PRO 提 示時顯示此視窗) 選項,產生 PRO 提示時,該視窗會在 VMM 主控台自動開啟。 PRO Tip (PRO 提示) 視窗會採用表格格式顯示來源、提示與 PRO 提示狀態這類資訊。該視窗也會顯示觸發警示 的問題說明、原因,以及建議的復原補救動作。 執行復原動作 PRO Tip (PRO 提示) 視窗提供執行或解除建議動作的選項。如果選擇 Implement (執行),VMM 會根據警示性質執 行以下所述的復原工作之一。 將主機置於限制模式 將主機置於 Restrict (限制) 模式,可防止在問題解決前將工作負載指派給主機。在此模式中,主機仍然會在 Operations Manager 收到警示,在 VMM 收到關聯的 PRO 提示。 虛擬主機上的非嚴重硬體警示,是可能觸發維護的系統健全狀況,例如 Dell PowerEdge 虛擬主機系統的周圍機 箱溫度警告。 虛擬機器移轉 PRO 提示管理套件使用 VMM 演算法,將虛擬機器
如果主機群組或主機叢集中沒有其他可用的狀況良好主機,PRO 提示移動虛擬機器的執行可能會失敗。在此情 況下,PRO Tip (PRO 提示) 視窗顯示的相應 PRO 提示狀態為 Failed (已失敗),原因在 Error (錯誤) 部分有詳細說 明。VMM 主控台 Jobs (作業) 部分中相應項目的狀態也顯示為 Failed (已失敗)。 註: 在 PRO Tip (PRO 提示) 視窗中,故障訊息會動態更新。然而,若要重新整理資料,您必須在 PRO Tip (PRO 提示) 視窗外按一下,然後再按一下讓視窗清晰。 如果選擇 Dismiss (解除),PRO 提示不會執行,而且會發生下列改變: • PRO 提示從 VMM PRO 提示主控台移除。 • Operations Manager 中的警示從 Dell Server PRO Alerts (Dell 伺服器 PRO 警示) 中刪除。 如需更多資訊,請參閱使用健全狀況總管重設警示。 虛擬機器即時移轉 身為已連線的使用者,即時移轉時,您可以將虛擬機器從 Windows Server 2008 R2 故障移轉叢集的一個節點, 移轉到相同叢集的其他節點,
若要存取 Alert View (警示檢視): 1. 啟動 Operations Manager 主控台。 2. 選取 Monitoring (監視) 標籤。 3. 從 Dell Server PRO Pack 選取 Dell Server PRO Alerts (Dell 伺服器 PRO 警示)。 這些警示顯示在螢幕的右側,如下圖所示。 狀態檢視 採用表格格式顯示探索到的 Dell 系統物件。狀態檢視會顯示物件及名稱、路徑、Dell 系統的儲存體效能等。您 可以定義要顯示哪些物件和資料的顯示方式,將狀態檢視個人化。 使用健全狀況總管重設警示 健全狀況總管能讓您檢視警示,並且對警示採取行動。在 PRO Tip (PRO 提示) 視窗選取 Dismiss (解除) 時,警示 便會從視窗移除。 若要手動重設警示: 1. 在 Actions (動作) 功能表中,按一下 Health Explorer (健全狀況檔案總管)。 2. 在要關閉的警示上按一下右鍵。 3.
• 1:用於移轉 • 2:用於將伺服器置於限制模式 變更預設復原動作旗標值,就可以覆寫預設復原動作,例如,使用 Operations Manager 主控台中提供的覆寫選 項,將復原旗標值從 2 變更為 1。將預設值覆寫為 1 並執行 PRO 提示之後,復原動作會觸發從主機移轉虛擬機 器。若您輸入 1 和 2 以外的任何其他值,將無法執行 PRO 提示,而且會顯示錯誤訊息。 若要覆寫該復原動作: 1. 在 Operations Manager 中按一下 Authoring (撰寫) 標籤。 2. 瀏覽至 Authoring (撰寫) → Management Pack Objects (管理套件物件) → Monitors (顯示器) 3. 搜尋 Dell PRO Pack 顯示器。 4. 選取要覆寫的顯示器。 5. 按一下滑鼠右鍵,然後選取 Overrides → Override Recovery (覆寫復原) → <顯示器> 。 6. 選取 Override (覆寫) 核取方塊。 7.
Dell 事件 ID Operations Manager 的警示說明和 VMM 中的 PRO 提示 1053 溫度感應器偵測到警 警告 告值 特定系統中背板、主 限制 機板、CPU 或碟機承 載器上的溫度感應器 超出其警告臨界值。 1054 溫度感應器偵測到故 錯誤 障值 特定系統中背板、主 限制和移轉 機板、CPU 或碟機承 載器上的溫度感應器 超出其故障臨界值。 1104 風扇感應器偵測到故 錯誤 障值 特定系統中的風扇感 限制 應器偵測到一個或多 個風扇有故障。 1154 電壓感應器偵測到故 錯誤 障值 特定系統中的電壓感 限制和移轉 應器超出其故障臨界 值。 1203 電流感應器偵測到警 警告 告值 中的電流感應器超出 限制 其警告臨界值。 1204 電流感應器偵測到故 錯誤 障值 特定系統中的電流感 限制和移轉 應器超出其故障臨界 值。 1305 冗餘降級 警告 特定系統中的電源感 限制 應器超出警告臨界 值。 1306 冗餘遺失 錯誤 電源已斷開或出故 障。 1353 電源供應器偵測到警 警告 告 特定系統中的電源感 限制 應器讀數超出
Dell 事件 ID Operations Manager 的警示說明和 VMM 中的 PRO 提示 重要性 警示原因 Dell PRO 提示推薦的 補救動作 作時,可能會發現故 障的元件。 2056 虛擬磁碟故障 嚴重 虛擬磁碟包含的一個 限制和移轉 或多個實體磁碟發生 故障。 2057 虛擬磁碟降級警告 警告 重複虛擬磁碟中包含 限制 的實體磁碟發生故障 時會出現此警示訊 息。 2076 虛擬磁碟一致性檢查 嚴重 故障 虛擬磁碟中包含的實 限制 體磁碟發生故障,或 同位檢查資訊有錯 誤。 2082 虛擬磁碟重建故障 嚴重 虛擬磁碟中包含的實 限制 體磁碟發生故障或損 毀。 2083 實體磁碟重建故障 嚴重 虛擬磁碟中包含的實 限制 體磁碟發生故障或損 毀。 2094 回報預測故障 警告 預測此實體磁碟有故 限制 障。 2100 溫度超出最大警告臨 警告 界值 實體磁碟機箱過熱。 限制 有好幾種因素都可能 導致溫度過高。 2101 溫度低於最小警告臨 警告 界值 實體磁碟外殼太冷。 限制 2102 溫度超出最大故障臨 嚴重 界值 實體磁
Dell 事件 ID Operations Manager 的警示說明和 VMM 中的 PRO 提示 重要性 警示原因 Dell PRO 提示推薦的 補救動作 2129 BGI (背景初始化) 失 敗錯誤 嚴重 虛擬磁碟的 BGI 發生 故障。 限制 2137 通訊逾時警告 警告 控制器無法與某機箱 限制和移轉 進行通訊。 2145 控制器電池電量低 警告 控制器電池電量低。 限制 2169 控制器電池需要更換 嚴重 控制器電池無法充 限制和移轉 電。電池的充電次數 可能已經達到上限。 此外,電池充電器可 能無法運作。 2171 控制器電池溫度高於 警告 正常溫度 室溫可能太熱。系統 限制 風扇可能也退化或故 障了。 2174 控制器電池已被移除 警告 控制器無法與電池通 限制和移轉 訊。電池可能已經取 出,或者接觸點可能 已經退化 2178 控制器電池記憶週期 警告 已逾時 在開始記憶週期前必 限制 須將控制器電池充滿 電。 2187 控制器 DIMM 上的單 警告 位元 ECC 錯誤已超出 限制 控制器記憶體發生故 限制和移轉 障。 220
Dell 事件 ID Operations Manager 的警示說明和 VMM 中的 PRO 提示 重要性 警示原因 2264 有設備遺失 警告 控制器無法與裝置通 限制 訊。裝置可能已經取 出。 2265 一個設備處於未知狀 警告 態 控制器無法與裝置通 限制和移轉 訊。無法判斷裝置狀 態。 2268 儲存管理通訊錯誤 嚴重 儲存管理無法與控制 限制和移轉 器通訊。如果控制器 驅動程式或韌體有問 題,就可能發生這個 情況。 2272 巡查讀取找到一個無 嚴重 法更正的媒體錯誤 巡查讀取任務遇到無 限制和移轉 法更正的錯誤。可能 有無法重新對應的壞 磁碟區塊。 2273 實體磁碟上的一個區 嚴重 塊被控制器刺穿 控制器在試圖讀取實 限制和移轉 體磁碟上的區塊時遇 到無法修復的媒體錯 誤,并將該區塊標示 為無效。 2282 熱備份磁碟 SMART 輪詢失敗 警告 控制器的韌體嘗試在 限制和移轉 熱備份磁碟上進行 SMART 輪詢,但是未 能完成該 SMART 輪 詢。 2283 冗餘路徑被破壞 警告 控制器有兩個連接器 限制和移轉 連接到同一個機箱。
Dell 事件 ID Operations Manager 的警示說明和 VMM 中的 PRO 提示 重要性 警示原因 2300 機箱不穩定故障 嚴重 控制器接收不到機箱 限制和移轉 發出的持續回應。 2301 機箱硬體錯誤 嚴重 機箱或機箱元件處於 限制和移轉 失敗或降級狀態。 2302 機箱未回應 嚴重 機箱或機箱元件處於 限制和移轉 失敗或降級狀態。 2306 損壞區塊表已填滿 80% 警告 損壞區塊表格用於重 限制 新對應損壞磁碟區 塊,會在損壞磁碟區 塊重新對應時填入。 2307 損壞區塊表已填滿。 嚴重 損壞區塊表格是用於 限制 重新對應損壞磁碟區 塊的表格。 2310 虛擬磁碟永久性降 級。 冗餘虛擬磁碟遺失了 限制和移轉 冗餘。虛擬磁碟有多 個實體磁碟故障時就 會發生這個情況。 2312 機箱中的一個電源發 警告 生 AC 故障。 電源發生 AC 故障。 限制 2313 機箱的電源供應器發 警告 生 DC 故障 電源發生 DC 故障。 限制 2314 SAS 元件的起始順序 嚴重 在系統啟動時故障, 不可能進行 SAS 管理
Dell 事件 ID Operations Manager 的警示說明和 VMM 中的 PRO 提示 重要性 警示原因 Dell PRO 提示推薦的 補救動作 可能過熱,以及變得 扭曲無法發揮功能。 2327 警告 NVRAM 有資料毀 損。控制器正在重新 初始化 NVRAM 限制和移轉 NVRAM 有資料毀 損。電源突波、電池 故障或其他原因都可 能導致這個情況。控 制器正在重新初始化 NVRAM 2328 NVRAM 有損毀資料 警告 限制和移轉 NVRAM 有資料損 毀。控制器無法修正 這個情況 2329 SAS 連接埠報告 警告 此警示的文字由控制 限制和移轉 器產生,可視情況而 改變。 2337 控制器無法從電池備 嚴重 份單元 (BBU) 復原快 取資料 控制器無法從快取復 限制 原資料。 2340 完成背景初始化 (BGI) 嚴重 時發生無法更正的錯 誤 背景初始化任務遇到 限制和移轉 無法更正的錯誤。 2342 檢查一致性發現不一 警告 致的同位檢查資料。 資料冗餘可能已經遺 失 源磁碟上的資料與目 限制和移轉 標磁碟上的冗餘資料 不一致。 2
Dell 事件 ID Operations Manager 的警示說明和 VMM 中的 PRO 提示 警示原因 Dell PRO 提示推薦的 補救動作 2396 一致性檢查偵測到多 嚴重 個無法更正的媒體錯 誤 實體磁碟有媒體錯 誤。 限制 2397 一致性檢查完成時發 嚴重 生無法更正的錯誤 實體磁碟有媒體錯 誤。 限制和移轉 2416 偵測到磁碟媒體錯誤 警告 偵測到磁碟媒體錯誤 限制 2417 虛擬磁碟上偵測到無 嚴重 法修復的媒體錯誤 虛擬磁碟上偵測到無 限制和移轉 法修復的媒體錯誤。 2,4 驅動程式名 稱:b06bdrv、 ebdrv b57w2k、 b57nd60x、 b57nd60a、l2nd Dell OMNIC Broadcom 嚴重 網路介面連結中斷 網路連結中斷。 限制 連結中斷。 限制 13,27,29,70 驅動程 Dell OMNIC Intel 網路 式名稱: 介面連結中斷 e1express、 e1qexpress、 ixgbe、e1000 20 重要性 嚴重
相關說明文件和資源 3 本章詳細說明各文件和參考資料,協助您使用 Pro Pack 3.0。 安全性考量 Operations Console 的存取權限是由 Operations Manager 內部處理。您可以使用 Operations Manager 主控台 Administration Security (管理安全性) 功能下的 User Roles (使用者角色) 選項來進行設定。指派給您的角色設定檔 決定了您可以執行哪些動作,以及您可以管理哪些物件。有關安全性考量的詳細資訊,請參閱 Microsoft System Center 2012 SP1 Operations Manager、Microsoft System Center 2012 Operations Manager、Microsoft System Center Operations Manager 2007 R2 或 Microsoft Systems Center Essentials 2010 線上說明等相關文件,網址是 technet.microsoft.