Nagios Core 適用的 Dell EMC OpenManage Plugin 3.
註、警示與警告 註: 「註」表示可以幫助您更有效地使用產品的重要資訊。 警示: 「警示」表示有可能會損壞硬體或導致資料遺失,並告訴您如何避免發生此類問題。 警告: 「警告」表示有可能會導致財產損失、人身傷害甚至死亡。 © 2015 -2018 Dell Inc. 或其子公司。著作權所有,並保留一切權利。Dell、EMC 與其他商標均為 Dell Inc.
目錄 1 Nagios Core 適用的 Dell EMC OpenManage Plug-in 3.0 版簡介..................................................................... 5 2 Dell EMC OpenManage Plug-in 3.0 版新功能.................................................................................................6 3 重要功能........................................................................................................................................................8 4 Support matrix.......................................................................
保固資訊屬性.................................................................................................................................................................. 36 設定 Dell EMC 保固資訊參數........................................................................................................................................36 檢視保固資訊..................................................................................................................................................................
1 Nagios Core 適用的 Dell EMC OpenManage Plugin 3.0 版簡介 本指南提供有關使用 Nagios Core 適用的 Dell EMC OpenManage Plug-in Version 3.0 及其各種功能的資訊;這些功能例如受支援的 Dell EMC 裝置的探索、監視、啟動主控台和疑難排解。本指南也提供了支援之 Dell EMC 裝置及客戶常見問題的詳細資料。 這個外掛程式可在 Nagios Core 管理的環境中,提供監視 Dell EMC 裝置的功能。這個外掛程式可讓您完全掌握 Dell EMC 裝置的硬體 層級,包括整體和元件層級的健全狀況監視。這個外掛程式提供基本的 Dell EMC 裝置詳細目錄資訊和事件監控。這個外掛程式也針 對支援的 Dell EMC 裝置,提供一對一 Web 主控台啟動支援,以便進一步執行故障排除、組態設定及管理活動。 如需裝置支援的詳細資料,請參閱《Nagios Core 適用的 Dell EMC OpenManage Plug-in 3.
2 Dell EMC OpenManage Plug-in 3.0 版新功能 下表列出 Dell EMC OpenManage Plug-in 3.0 版的新特色與功能: 表 1. 新特色和功能 新特色 說明 支援新款 Dell EMC 裝置 使用此版本,您可以探索和監視下列新 Dell EMC 裝置: • 透過 Integrated Dell Remote Access Controller (iDRAC) with Lifecycle Controller (LC) 新啟動的 第 14 代 PowerEdge 伺服器 • OEM 伺服器 • Dell EMC Network Switch 如需裝置支援的更多詳細資料,請參閱《Nagios XI 適用的 Dell EMC OpenManage Plug-in 3.
新特色 說明 檢視保固資訊 此功能可讓您檢視 OEM 伺服器和 Dell EMC Network Switch 的保固資訊。 檢視知識庫 (KB) 訊息 您可以透過與 SNMP 警示相關的 KB 文章,取得這類警示的相關詳細資訊。您可以檢視 OEM 伺 服器和 HCI 平台的 KB 訊息。 Dell EMC OpenManage Plug-in 3.
3 重要功能 Nagios Core 適用的 Dell EMC OpenManage Plug-in 3.0 版主要功能如下表所述。 表 2.
4 Support matrix Dell EMC OpenManage Plug-in version 3.0 for Nagios Core supports the Dell EMC devices as listed in the following tables. Datacenter Scalable Solutions Table 3. Supported Datacenter Scalable Solutions. Datacenter Scalable Solutions (DSS) DSS 1500 DSS 1510 DSS 2500 Hyper-converged Infrastructure (HCI) Platforms Table 4.
PowerEdge Servers Table 5. Supported PowerEdge Servers.
Compellent SC-Series Storage Arrays Table 7. Supported Compellent Storage Arrays. Compellent Series 40 Compellent SC4020 Compellent SC5020 Compellent SC7020 Compellent SC8000 Compellent SC9000 EqualLogic PS-Series Storage Arrays Table 8. Supported EqualLogic PS-Series Storage Arrays.
Dell EMC Network Switches Table 10.
5 裝置探索和清查 主題: • About device discovery • About Dell EMC device discovery utility • 探索 Dell EMC 裝置 • 裝置資訊 About device discovery You can discover the supported Dell EMC devices with this plug-in in the Nagios Core console. The monitoring protocols for the supported Dell EMC devices are as follows: • Dell EMC Servers are discovered using SNMP or WSMan protocol or Redfish REST APIs. • Dell EMC Chassis are discovered using WSMan protocol.
is the installed location of Nagios Core and by default, the location of is /usr/local/nagios. About Dell EMC device discovery utility To run the Dell Device Discovery Utility, navigate to /dell/scripts, and run the following Python command: python dellemc_nagios_discovery_service_utility.py -h All the available Dell EMC device discovery utility options are displayed. Table 11.
Options Description If --enable parameter is passed, the logs are created else the logs are not created. --force --force rewrites the config file. --warranty.criticalDays Warranty critical days. Allowed value is [1-365]. Default value is 10. NOTE: The value of Warranty critical days should be less than Warranty warning days. --warranty.warningDays Warranty warning days. Allowed value is [1-365]. Default value is 30. --nagios.type Decides the output format of the host file.
Services SNMP WSMan Protocol Redfish Protocol Dell EMC Memory Status √ √ X Dell EMC Server Physical Disk Status √ √ X Dell EMC Server Virtual Disk Status √ √ X Dell EMC Server Fan Status √ √ √ Dell EMC Server Battery Status √ √ X Dell EMC Server Intrusion Status √ √ X Dell EMC Server Network Device Status √ √ √ Dell EMC Server Voltage Probe Status √ √ √ Dell EMC Server Controller Status √ √ √ Dell EMC Server Amperage Probe Status √ √ X Dell EMC Server CPU Status
Services Dell EMC Chassis Virtual Disk Status (This service is applicable to PowerEdge VRTX Chassis only) Dell EMC Chassis PCIe Devices Status (This service is applicable to PowerEdge VRTX Chassis and PowerEdge FX2/FX2s Chassis only) Table 15.
Table 17.
指令碼語法和選項相關資訊隨即顯示。如需詳細資訊,請參閱關於 Dell 探索公用程式。 根據您的需求,請執行下列動作: • 使用主機 IP 位址來探索 SNMP 裝置: python dellemc_nagios_discovery_utility.py --host= -snmp.version=2 --output.file=/usr/local/nagios/dell/config/objects/ • 使用 Filepath,透過 WSMan 通訊協定/ Redfish REST API 來探索: python dellemc_nagios_discovery_utility.py --file= --http.user=root -http.password=calvin --output.
表 19.
服務 狀態 顯示的屬性 • 確定 • 產品系列 • 不明 • 服務標籤 • 嚴重 • 機型名稱 • 警告 • 機箱類型 • 磁碟計數 • RAID 狀態 • 韌體版本 • RAID 原則 • 組群名稱 • 群組 IP • 儲存區 • Capacity(GB) (容量(GB)) • 組群名稱 Dell EMC Storage PS 系列群組 可能狀態如下: 資訊 • 確定 Dell EMC Storage MD 系列資 訊 說明 這項服務提供了 EqualLogic 群 組的基本裝置詳細目錄資訊 • 成員計數 • 不明 • 磁碟區計數 • 嚴重 • 群組 URL • 警告 可能狀態如下: • 確定 • 不明 這項服務提供了 PowerVault MD • 系列儲存陣列的基本裝置詳細 • 目錄資訊 • • 嚴重 • 全球 ID • 警告 • 儲存裝置名稱 • HostName • Model Dell EMC Network Switch 資訊 可能狀態如下: 本服務提供網
6 監視 Dell EMC 裝置 您可以監視 Dell EMC 裝置的各層面,如下列各節所述。 主題: • Dell EMC 裝置的整體健全狀況 • 監視 Dell EMC 裝置的元件健全狀況 • 監視 SNMP 警示 Dell EMC 裝置的整體健全狀況 您可以在 Nagios Core 主控台中監視 Dell EMC 裝置的整體健全狀況。整體健全狀況是支援的 Dell EMC 裝置元件的彙總狀態。 健全狀況例項 您可使用 Nagios Core 主控台來監視所有 Dell EMC 裝置的健全狀況例項。健全狀況例項代表探索到的 Dell EMC 裝置的健全狀況。例 項會顯示在狀態資訊標籤之下。 根據預設,Nagios Core 主控台會顯示探索到的裝置之不健全狀況例項。根據監視需求,您可以變更主機組態檔案內的 -excludeinstance 值。變更值之後,重新啟動 Nagios 服務。 註: 若要在 Nagios Core 主控台中檢視 Dell EMC 裝置任何服務的所有例項,請導覽至 /dell/config/ objects,並按一下探索到的裝置之 cfg
服務 狀態 • 說明 嚴重 使用 WSMan 時顯示 屬性 使用 SNMP 時顯示屬 性 • 入侵 • 入侵 • 記憶體 • 記憶體 • 電池 • 電池 • CPU • CPU • 溫度 • 溫度 使用 Redfish 時顯示屬 性 Dell EMC 機箱整 體健全狀況 提供 Dell EMC 機箱的全域健 全狀況。 整體機箱 不可用 不可用 Dell EMC Storage PS 系列成員整體 健全狀況 提供 EqualLogic 儲 存陣列的全域 健全狀況。 不可用 整體成員 不可用 Dell EMC Storage SC 系列整體健全 狀況 提供 Compellent 儲 存陣列的全域 健全狀況。 不可用 整體儲存中心 不可用 Dell EMC Storage SC 系列控制器整 體健全狀況 提供 Compellent 儲 存陣列控制器 的全域健全狀 況。 不可用 整體控制器 不可用 Dell EMC Storage MD 系列整體健全 狀況 提供 不可用 PowerVault MD 儲存陣列的全 域健全狀況
About monitoring component health of Dell EMC devices This is a periodic poll based health monitoring of a Dell EMC device’s component level health status. Once the discovery utility is run with the relevant option, the corresponding services are created. These services run periodically and update the overall health of the components. The component’s status and information are displayed in the Nagios Core user interface.
Service Dell EMC Server Intrusion Status Dell EMC Server Network Device Status Dell EMC Server CPU Status Dell EMC Server Power Supply Status Status Description Attributes displayed Attributes displayed when using WSMan when using SNMP Attributes displayed when using Redfish Server without considering the redundancy status.
Service Status Description Provides the worst case aggregate health status of the storage controllers in Dell EMC Servers. Dell EMC Server Controller Status Provides overall health status of the amperage probe in Dell EMC Servers.
Service Dell EMC Chassis PCIe Devices Status Dell EMC Chassis Fan Status Dell EMC Chassis Power Supply Status Dell EMC Chassis Controller Status Applicable only to PowerEdge VRTX chassis. Dell EMC Chassis Enclosure Status Applicable only to PowerEdge VRTX chassis.
Service Status Dell EMC Chassis IO Module Status Description Attributes Displayed Provides the worst case aggregate health status of the IO module in Dell EMC Chassis.
Service Status Description Attributes Displayed • Provides the worst case • aggregate health status of the EqualLogic Group volume status. • Dell EMC Storage PS-Series Group Volume Status Dell EMC Storage PS-Series Group Storage Pool Information Provides warranty information status for the EqualLogic storage arrays. Status Name • TotalSize(GB) • AssociatedPool Provides the worst case • aggregate health status of all the • EqualLogic storage arrays in a storage pool.
Table 25. PowerVault MD warranty information Service Status Description Dell EMC Storage MD-Series Warranty Information The following states are possible: Provides warranty information status for the PowerVault MD storage arrays. • OK Attributes Displayed when using SNMP • ServiceTag • Service Level Details Warning • Item number • Unknown • Device Type • Critical • Ship Date(UTC) • Start Date(UTC) • End Date(UTC) • Days Remaining • Table 26.
Service Dell EMC Network Switch Warranty Information Description Provides warranty information status for the Dell EMC Network Switch Attributes Displayed when using SNMP • Type • Name • ServiceTag • Service Level Details • Item Number • Device Type • Ship Date • Start Date • End Date • Days Remaining NOTE: For more information about monitoring the health of the Compellent controllers, see the specific Dell Compellent Controllers User’s Guide at Dell.com/support.
Viewing Dell EMC devices in the Nagios Core console To view the Dell EMC devices in the Nagios Core console, ensure that the devices are already discovered and inventoried. You can view the discovered Dell EMC devices in Nagios Core in the Hosts or the Services view: 1 To view the hosts in the Nagios Core, select Hosts under Current Status in the left pane. The hosts are displayed in the right pane.
監視 SNMP 警示 關於 SNMP 警示監視 您可以非同步方式從裝置接收轉寄的 SNMP 警示。 收到 SNMP 警示後,個別裝置的服務會在 Nagios Core 主控台顯示警示摘要訊息,以及最後收到之警示的警示嚴重程度。 表 28.
服務 狀態 Dell EMC Storage MD 系列設陷 Dell EMC Network Switch 陷阱 • 嚴重 • 不明 可能狀態如下: • 確定 • 警告 • 嚴重 • 不明 可能狀態如下: • 確定 • 警告 • 嚴重 • 不明 說明 提供 PowerVault MD 系列儲存陣列的設陷 資訊。 提供 Dell EMC Network Switch 的陷阱資 訊。 檢視 SNMP 警示 先決條件: • 已安裝設定 Nagios Core with SNMPTT,並在 SNMPTT 設定 Dell 整合。 • 支援的 Dell EMC 裝置已透過 Nagios Core 伺服器設定 SNMP 設陷目的地。 註: 若要從 PowerVault MD 34/38 系列儲存陣列接收 SNMP 設陷,必須在 Modular Disk Storage Manager (MDSM) 主控台中 設定該裝置的 SNMP 設陷目的地。 如需在 iDRAC 介面設定 SNMP 設陷目的地的資訊,請參閱附錄。 若要檢視 SNMP 警示: 在 Nagios
7 啟動特定 Dell EMC 裝置主控台 啟動支援之 Dell EMC 裝置的主控台: 1 2 在 Nagios Core 主控台目前的狀態下,選取下列其中一項: • 主機 • 服務 • Host Groups (主機群組) > 按一下 Dell EMC 裝置旁的 (執行額外的主機動作圖示)。 個別 Dell EMC 主控台隨即在新視窗中啟動。 Dell EMC 裝置及其主控台 您可以從支援的 Dell EMC 裝置啟動各種 Dell EMC 主控台,取得要監視之 Dell EMC 裝置的相關詳細資訊。 表 29.
8 Dell EMC 裝置保固資訊 使用此功能時,您可以存取已探索 Dell 裝置的保固資訊。此功能可讓您在 Nagios Core 主控台中監視 Dell EMC 裝置保固詳細資料。需 有可用的網際網路連線才能取得保固資訊。如果無法直接存取網際網路,且使用 Proxy 設定存取網際網路,請務必解析 etc/hosts 檔案中 api.dell.
• 網際網路連線中。 • 探索到的裝置有有效的服務標籤。 成功探索到裝置後,Status Information (狀態資訊) 欄便會顯示其保固資訊。若要檢視 Dell EMC 裝置的詳細資料: 1 探索 Dell EMC 裝置。 2 按一下服務底下的 Warranty Information ( 保固資訊)。 Service State Information 頁面會顯示所選裝置的詳細資料。 例如: 若要檢視 VRTX 機箱的保固服務資訊,請按一下 Dell EMC Chassis Warranty Information (Dell EMC 機箱保固資訊)。 註: 若為 EqualLogic 儲存陣列,保固服務只會與 EqualLogic 成員 IP 相關聯。 若為 Compellent 儲存陣列,保固服務只會與 Compellent 控制器 IP 相關聯。 Dell EMC 裝置保固資訊 37
9 移除 Dell EMC 裝置 您可以移除不想要監視的 Dell EMC 裝置。 1 請瀏覽至 /dell/config/objects 並刪除對應的 .
10 Knowledge Base messages for the generated alerts You can get more information about the SNMP alerts generated by the discovered Dell EMC devices from the KB messages for that device in the Nagios Core console. Viewing KB messages To view the KB messages for an SNMP alert generated by a discovered Dell EMC device complete the following steps: 1 Log in to the Nagios Core console. 2 In the left pane, click on Services under Current Status.
11 疑難排解 本章節列出使用 Nagios Core 適用的 Dell EMC OpenManage Plug-in 時可能會遇到的問題及其因應措施。 請確定您符合需求,或執行本節列出的步驟。 在 Ubuntu 設定適用的 Nagios Core 主控台中未收到 Dell EMC 裝置的 SNMP 設陷 解決方式:在 /libexec/eventhandlers/submit_check_result 中,以 #!/bin/bash 取代 #!/bin/sh,然後重新啟動 SNMPTT 及 Nagios 服務。 Nagios 主控台未收到 eqlMemberGatewayIPAddrChanged 設陷 解決方式:變更 EqualLogic 成員閘道 IP 位址後,您需要確定從 EqualLogic 成員或 EqualLogic 群組至陷阱接聽程式有可用的連線。 Nagios Core 適用的 Dell EMC OpenManage Plug-in 安 裝指令碼失敗 1 您有的權限足夠執行指令碼。 建議使用:Nagios 管理員。 2 符合安裝指南所述的事前準備作業。
探索指令碼並未為 IPv4 或 IPv6 位址或主機建立主機 與服務定義檔案 1 已安裝 OMSDK。 2 IP 位址或主機可連線。 3 指定的 IP 位址或主機已啟用 SNMP 或 WSMan 或 Redfish。 4 適當的通訊協定參數已在探索期間傳遞。 裝置探索後,Dell EMC 裝置的 IP 位址或主機名稱變 更 移除舊的組態檔案,然後用新的 IP 位址或主機名稱重新探索 Dell EMC 裝置。 Nagios Core 主控台未顯示用 Dell EMC 探索指令碼探 索到的 Dell EMC 裝置 1 /dell/config/objects 資料夾有主機和服務定義檔案。 2 執行探索後,Nagios 服務已重新啟動。 3 主機和服務定義檔案擁有適當權限。 Nagios Core 主控台未針對用 Dell EMC 探索指令碼探 索到的 Dell EMC 裝置顯示設陷服務 1 已安裝 SNMPTT。 2 如果未安裝 SNMPTT,就不會為任何探索到的 Dell EMC 裝置建立服務。 3 安裝 SNMPTT 後,請確定有執行設陷整合。
Dell EMC OpenManage Plug-in 特定服務顯示「與主 機通訊時發生 Redfish 錯誤」的訊息 1 已在 IP 位址或主機上啟用 Redfish。 2 所提供的 IP 位址或主機可連線。 Dell EMC OpenManage Plug-in 特定服務顯示「Component Information = UNKNOWN」(元件資訊 = 不明) 訊息 註: 如果探索到的 Dell EMC 裝置無法使用該元件,就會出現這個訊息。 如果元件可供使用但您還是收到這則訊息,那麼出現這個訊息的原因便在於通訊協定逾時。在 /dell/config/ objects 可用的主機組態檔案中設定所需的通訊協定特定逾時值。 無法在 Nagios Core 主控台中檢視 Dell EMC 裝置產生 的 SNMP 警示 1 請從 /dell/install 執行命令,執行設陷整合: ./install.
變更 Nagios 管理伺服器 IP 位址後,無法從裝置設陷 檢視 KB 資訊 您必須將新的 IP 位址更新至以下組態檔案中: • Dell_Agent_free_Server_Traps.conf • Dell_Chassis_Traps.conf • Dell_EqualLogic_Traps.conf 註: 依預設,組態檔案的位置如下:/dell/config/templates 若要在上述的組態檔案中更新新 IP 位址,請執行下列命令,然後重新啟動 snmptt 服務: sed -i s///g /dell/config/templates/Dell*_Traps.
12 常見問題 1 問題:您可以提供有關 Nagios Core 適用的 Dell EMC OpenManage Plug-in 授權相關資訊嗎? 回答:您可以免費安裝和使用這個外掛程式。 2 問題:這個外掛程式支援哪些 Dell EMC 硬體機型? 回答:如需支援的 Dell EMC 平台清單,請參閱支援表格。 3 問題:我的資料中心有舊版伺服器 (第 9 代到第 11 代)。我還是可以用外掛程式監視它們嗎? 回答:不可以,您無法用這個外掛程式監視舊版伺服器 (第 9 代到第 11 代)。您只能使用支援第 12 代和更新版 PowerEdge 伺服 器的這個外掛程式,透過 iDRAC (含 LC) 監視 Dell 伺服器。Nagios Exchange 有其他外掛程式可供使用,讓您得以監視舊版伺服 器。 4 問題:監視 Dell 伺服器的頻內與頻外 (OOB) 方法有什麼不同? 回答:監視 Dell 伺服器有兩種方式,其一是透過安裝在伺服器作業系統的 OpenManage Server Administrator (OMSA) 這個軟體, 另一種是透過 iDRAC with LC 的頻內方法。
A 附錄 使用 iDRAC Web 主控台設定 iDRAC 的 SNMP 參數 1 啟動 iDRAC (第 12 代與第 13 代的 PowerEdge 伺服器) Web 主控台,然後導覽至主控台內的 iDRAC 設定 > 網路 > 服務。 若為第 14 代 PowerEdge 伺服器,請啟動 iDRAC Web 主控台並導覽至 iDRAC 設定 > 服務 2 設定 SNMP 代理程式的內容: a 將 [Enabled] (啟用) 設為 True,SNMP Protocol (SNMP 通訊協定) 設為 All (SNMP v1/v2/v3)。 b 以社群字串設定 SNMP 社群名稱。 c 按一下套用提交組態。 註: 外掛程式只用 SNMP v1 或 SNMP v2 通訊協定與 iDRAC 通訊。 使用 iDRAC Web 主控台設定 iDRAC 的 SNMP 設陷目 的地位址 第 12 代和第 13 代 PowerEdge 伺服器。 1 登入 iDRAC。 2 選取 Overview > Alerts。 3 在右窗格中,請執行下列動作: • 在 Alerts 部分,啟用 Al
• 46 在 SNMP Traps Configuration 部分,選取所需的 SNMP 設陷格式,然後按一下 Apply。 附錄