Dell™ Server PRO Management Pack 2.0 Für Microsoft® System Center Virtual Machine Manager Benutzerhandbuch w w w. d e l l . c o m | s u p p o r t . d e l l .
Anmerkungen und Vorsichtshinweise ANMERKUNG: Eine ANMERKUNG zeigt wichtige Informationen an, mit denen Sie das System besser einsetzen können. VORSICHT: Ein VORSICHTSHINWEIS zeigt Ihnen potenzielle Gefahrenquellen an, die Hardwareschäden oder Datenverlust zur Folge haben könnten, wenn Anweisungen nicht befolgt werden. ____________________ Irrtümer und technische Änderungen vorbehalten. © 2009 Dell Inc. Alle Rechte vorbehalten.
Inhaltsverzeichnis 1 Einführung . . . . . . . . . . . . . . . . . . . . . . . . . 5 . . . . . . . . . . . . . . . 6 . . . . . . . . . . . . . . . . . . . . . . . . . 6 . . . . . . . . . . . . . . . . . . . . 6 Was ist ein PRO Tip? . . . . . . . . . . . . . . . . . . . 7 Funktions-Highlights . . . . . . . . . . . . . . . . . . . 7 . . . . . . . . 8 Neuheiten in dieser Version Übersicht Zugehörige Begriffe Zum Verständnis der PRO Tip-Verwaltung Unterstützte Betriebssysteme . . . . . . .
. . . . . . . . . . . . . . 20 . . . . . . . . . . . . . . . . 20 Deinstallation von PRO Pack Sicherheitsüberlegungen 3 Verwendung von Dell PRO Pack . . . . . . . Überwachung unter Verwendung von SCVMM . Implementierung von Wiederherstellungsmaßnahmen . . . . . 21 . . . . . . . . . 22 Überwachung mithilfe der PRO-spezifischen Warnhinweise auf SCOM/SCE . . . . . . . . . . . . . 26 . . . . . . 27 . . . . . . . . . . . . 27 Zurücksetzen von Warnhinweisen mithilfe des Health Explorers . . .
1 Einführung Dieses Dokument richtet sich an Systemadministratoren, die das Dell™ Server PRO Management Pack (Dell PRO Pack) zur Überwachung von Dell-Systemen und zum Ergreifen von Störungsbeseitigungsmaßnahmen verwenden, wenn ein ineffizientes System festgestellt wird.
Neuheiten in dieser Version Diese Version des PRO Pack unterstützt Folgendes: • SCOM 2007 R2 • SCVMM 2008 R2 • Live-Migration von virtuellen Computern ohne Ausfallzeit • Funktion zum Außer-Kraft-Setzen der StandardWiederherstellungsmaßnahmen des Dell PRO Pack • Zusätzliche Dell OpenManage™-Warnhinweise • Änderung in den Namen von Wiederherstellungsmaßnahmen von “Wartungsmodus” und “VM-Migration” in PRO Pack 1.
• Eine Management Station (oder) Managing Station kann ein Microsoft Windows-basiertes Dell-System sein, auf dem Operations Manager und SCVMM installiert sind, um virtuelle Arbeitslasten zu verwalten. Was ist ein PRO Tip? PRO (Performance and Resource Optimization, Leistungs- und Ressourcenoptimierung) ist eine Funktion, die die Überwachung der virtualisierten Infrastruktur ermöglicht und einen Hinweis ausgibt, wenn sich eine Gelegenheit zum Optimieren der Nutzung dieser Ressourcen bietet.
• Generiert einen PRO Tip, wenn die überwachte Hardware in einen funktionsuntüchtigen Zustand übergeht. • Beschränkt Ausfallzeiten auf ein Minimum, indem die in den PRO Tips bereitgestellten Störungsbeseitigungsmaßnahmen implementiert werden. Die beiden Störungsbeseitigungsmaßnahmen lauten: • Einschränken: Es wird empfohlen, den Server vorübergehend nicht verfügbar zu machen, damit so lange keine neuen VMs platziert werden können, bis die Wartungs-Tasks abgeschlossen sind.
Abbildung 1-1.
Tabelle 1-1. Ereignisreihenfolge mit Beschreibung Reihenfolgenummer Ereignis 1 Die auf dem Host installierten Operations ManagerAgenten ermitteln die Warnungs-, Fehler- oder Ausfallhinweise, die von Dell OpenManage Server Administrator protokolliert werden. 2 Warnhinweis wird an Operations Manager gesendet. 3 Die Operations Manager-Konsole zeigt aktive PROspezifische Warnhinweise an. 4 Operations Manager benachrichtigt SCVMM über den Warnhinweis und die damit in Verbindung stehende PRO Tip-ID.
Unterstützte Betriebssysteme Konsultieren Sie für die detaillierte Betriebssystem-Support-Matrix die Dell PRO Pack-Infodatei DellPROMP2.0_Readme.txt. Die Infodatei ist in der selbstextrahierenden ausführbaren Datei Dell_ PROPack_2.0.0_A00.exe verpackt.Sie befindet sich auch auf der Systems ManagementDokumentationsseite auf der Dell Support-Website unter support.dell.com/manuals.
• Das Dell OpenManage Server Administrator Storage ManagementBenutzerhandbuch ist ein umfassendes Nachschlagewerk für die Konfiguration und Verwaltung lokaler und externer Speicherkomponenten, die an ein System angeschlossen sind. Dieses Dokument steht auf der DVD Dell Systems Management Tools and Documentation auch in HTML- und PDF-Format sowie auf der Speicherverwaltungskonsole als OnlineHilfedatei zur Verfügung.
Erste Schritte mit Dell PRO Pack 2 Minimale Anforderungen Zum Implementieren des Dell™ PRO Pack muss sichergestellt werden, dass die folgende minimale Ausführungsumgebung vorhanden ist: • • • Management Station: • Microsoft® System Center Operations Management (SCOM) 2007 SP1/R2 oder System Center Essentials (SCE) 2007, installiert auf einem unterstützten Hardware- und Betriebssystem • System Center Virtual Machine Manager (SCVMM) 2008/R2, installiert auf einem unterstützten Hardware- und Betriebssy
Installation von SCOM/SCE- und SCVMM-Agenten Wenn Sie das Setup zur Überwachung der Infrastruktur verwenden, ermöglichen auf den verwalteten Hosts installierte SCOM/SCE- (Operations Manager) und SCVMM-Agenten die Datenübertragung zwischen dem verwalteten System und den Management Stations. Agenten sowohl von SCVMM als auch von Operations Manager werden während des Ermittlungsvorgangs manuell oder automatisch auf allen Hyper-V-Hosts installiert.
6 Klicken Sie auf Öffnen. Der Bildschirm Management Packs importieren wird im Abschnitt Details zum Management Pack mit einer Warnungsmeldung angezeigt, wie in Abbildung 2-1 dargestellt. Operations Manager zeigt diese Standardwarnung als Teil des Sicherheitsverfahrens an, wenn ein Management Pack manuell installiert wird. Weitere Informationen dazu, wie Sie die Sicherheitseinstellungen für das manuelle Installieren der Management Packs ändern können, finden Sie in der Microsoft TechNet Library.
Konfiguration von PRO Tips Die Dell-Systeme und die virtuelle Infrastruktur werden auf Warnhinweise des Typs Kritisch oder auf Warnhinweise sowohl des Typs Kritisch als auch des Typs Warnung überwacht. • Ein Warnungshinweis wird generiert, wenn sich der Messwert einer Komponente oberhalb oder unterhalb des zulässigen Niveaus befindet. Beispiel: Die Komponente funktioniert möglicherweise noch; jedoch könnte sie potentiell ausfallen oder die Komponente funktioniert in beeinträchtigtem Zustand.
Abbildung 2-2. Konfiguration von PRO Tips 3 Wählen Sie die Registerkarte PRO und anschließend die Option Enable PRO on this Host Group (PRO bei dieser Host-Gruppe aktivieren) aus. 4 Standardmäßig ist die Überwachungsebene auf Warnung und Kritisch eingestellt, was bedeutet, dass die Anwendung PRO Tips anzeigen wird, die zu Hinweisen sowohl des Typs Warnung als auch des Typs Kritisch generiert werden.
Testen des Setup unter Verwendung von Szenarien Um zu bestätigen, dass das importierte Dell PRO Pack voll funktionsfähig ist, erstellen Sie die in den beiden Tabellen aufgeführten Szenarien und überprüfen Sie, ob die unter der Spalte “Erwartete Systemreaktion” aufgeführten Aktivitäten ausgeführt werden. Szenario 1 – Die Temperatur der Rückwandplatine überschreitet den Warnungsschwellenwert auf einem Managed System. Tabelle 2-1. Überprüfung der Wiederherstellungsmaßnahme für Warnungszustände.
Szenario 2 – Die Temperatur der Rückwandplatine überschreitet den Ausfallschwellenwert auf einem Managed System. Tabelle 2-2. Wiederherstellungsmaßnahme für Fehlerzustände wird überprüft. Ihre Maßnahmen Erwartete Systemreaktion Erzeugen Sie auf dem Managed System einen derartigen Temperaturwarnhinweis, als ob die Temperatur der Rückwandplatine den Fehlerschwellenwert überschreitet. Die Ereignis-ID lautet 1054 und die Quelle ist OpenManage Server Administrator.
Tabelle 2-2. Wiederherstellungsmaßnahme für Fehlerzustände wird überprüft. Ihre Maßnahmen Erwartete Systemreaktion Wählen Sie im PRO Tip-Fenster die Option Verwerfen anstatt der Option Implementieren aus. Es werden keine Maßnahmen ergriffen und virtuellen Systeme werden nicht verschoben. Der entsprechende PRO Tip-Eintrag wird aus dem PRO Tip-Fenster entfernt. Weitere Informationen finden Sie unter “Zurücksetzen von Warnhinweisen mithilfe des Health Explorers”.
Verwendung von Dell PRO Pack 3 Überwachung unter Verwendung von SCVMM Sie können den Funktionszustand Ihrer virtualisierten Umgebung vewalten, indem Sie PRO Tips verwenden, die auf der SCVMM-Konsole angezeigt werden. Um das PRO Tip-Fenster einzublenden, klicken Sie auf das Menü PRO Tips auf der Symbolleiste unterhalb des Hauptmenüs, wie in Abbildung 3-1 dargestellt. Im Menü wird die Anzahl aktiver PRO Tips in eckigen Klammern angezeigt. Abbildung 3-1.
Abbildung 3-2. PRO Tip-Fenster Implementierung von Wiederherstellungsmaßnahmen Das PRO Tip-Fenster bietet die Option, die empfohlene Maßnahme entweder zu implementieren oder zu verwerfen. Bei Wahl der Option Implementieren implementiert SCVMM entsprechend der Art des Warnhinweises einen der nachstehend beschriebenen Wiederherstellungs-Tasks.
funktionstüchtigen. Die beiden SCVMM-Algorithmen lauten Lastenausgleich und Ressourcenmaximierung. Wählen Sie den Algorithmus Lastenausgleich, wenn SCVMM virtuelle Computer (VMs) gleichmäßig über einen Pool von Hosts verteilen soll. Wählen Sie den Algorithmus Ressourcen-Maximierung, wenn der Host vollständig gesättigt werden soll, bevor Sie zu einem anderen übergehen.
Abbildung 3-3. Abgeschlossener Auftrag Die PRO Tip-Implementierung des Verschiebens von VMs kann fehlschlagen, wenn in der Host-Gruppe oder im Host-Cluster keine anderen funktionstüchtigen Hosts verfügbar sind. In solchen Fällen wird der Zustand des entsprechenden PRO Tip im PRO Tip-Fenster als Fehlerhaft angezeigt und die entsprechende Ursache wird im Bereich Fehler näher erläutert. Der Status des entsprechenden Eintrags im Bereich Aufträge auf der SCVMM-Konsole wird ebenfalls als Fehlerhaft angezeigt.
VM-Live-Migration Mit der Live-Migration können Sie eine VM von einem Knoten eines Windows Server 2008 R2-Failover-Clusters ohne Ausfallzeit zu einem anderen Knoten im selben Cluster migrieren. Als verbundener Benutzer treten für Sie während der Live-Migration keine Unterbrechungen auf. Der Unterschied zwischen Schnellmigration und Live-Migration besteht darin, dass bei der Schnellmigration eine Ausfallzeit auftritt, während dies bei der LiveMigration nicht der Fall ist.
Überwachung mithilfe der PRO-spezifischen Warnhinweise auf SCOM/SCE Sie können die physikalischen Geräte in Ihrem Netzwerk über die Operations Manager-Konsole überwachen. Die Konsole des Operations Manager bietet die folgenden Ansichten: • Warnungsansicht – Enthält Dell PRO-spezifische Warnhinweise in Tabellenformat mit Informationen zu Schweregrad, Quelle, Name, Auflösungszustand sowie Datum und Uhrzeit der Erstellung.
Abbildung 3-6. Zustandsansicht Weitere Informationen zum Erstellen einer Zustandsansicht finden Sie auf der Website von Microsoft. Zurücksetzen von Warnhinweisen mithilfe des Health Explorers Health Explorer ermöglicht es Ihnen, Warnhinweise anzuzeigen und entsprechende Maßnahmen zu ergreifen. Wenn Sie im PRO Tip-Fenster die Option Verwerfen auswählen, wird der Warnhinweis aus dem PRO Tip-Fenster entfernt.
Die standardmäßigen Wiederherstellungsmaßnahmen können außer Kraft gesetzt werden, indem Sie den standardmäßigen Flag-Wert der Wiederherstellungsmaßnahme ändern. Ändern Sie z. B. den WiederherstellungsFlag-Wert mithilfe der in SCOM bereitgestellten Option zum außer Kraft setzen von ‘2’ in ‘1’ Nachdem Sie den Standardwert durch außer Kraft setzen auf ‘1’ gesetzt haben und der PRO Tip implementiert wurde, löst die Wiederherstellungsmaßnahme die Migration der virtuellen Computer vom Host aus. PRO Pack 2.
Hierdurch wird überprüft, ob die außer Kraft gesetzte Wiederherstellungsmaßnahme erfolgreich verlaufen ist. Abbildung 3-7.
Tabelle 3-1. Ursache des Warnhinweises und Wiederherstellungsmaßnahme Beschreibung des DellEreignis- Warnhinweises in SCOM/ SCE & PRO ID Tip in SCVMM Schweregrad Ursache des Warnhinweises 1053 Temperatursensor hat einen Warnungswert festgestellt Warnung Ein Temperatursensor Einschränken auf der Rückwandplatine, der Systemplatine, der CPU oder dem Laufwerkträger im angegebenen System ermittelte ein Überschreiten des Warnungsschwellenwerts.
Tabelle 3-1. Ursache des Warnhinweises und Wiederherstellungsmaßnahme (fortgesetzt) Beschreibung des DellEreignis- Warnhinweises in SCOM/ SCE & PRO ID Tip in SCVMM Schweregrad Ursache des Warnhinweises Im Dell PRO Tip empfohlene Störungsbeseitigungsmaßnahme 1204 Stromsensor hat einen Fehlerwert festgestellt. Fehler Ein Stromsensor im angegebenen System hat seinen Fehlerschwellenwert überschritten. Einschränken und Migrieren 1305 Redundanz herabgesetzt.
Tabelle 3-1. Ursache des Warnhinweises und Wiederherstellungsmaßnahme (fortgesetzt) Beschreibung des DellEreignis- Warnhinweises in SCOM/ SCE & PRO ID Tip in SCVMM Schweregrad Ursache des Warnhinweises 1404 Fehler des Speichergeräts. Fehler Die Korrekturrate eines Einschränken und Migrieren Speichergeräts hat einen akzeptierbaren Wert überschritten, eine Speicher-SpareBank wurde aktiviert oder es ist ein MultibitECC-Fehler aufgetreten. 1703 Batteriesensor hat einen Warnungswert festgestellt.
Tabelle 3-1. Ursache des Warnhinweises und Wiederherstellungsmaßnahme (fortgesetzt) Beschreibung des DellEreignis- Warnhinweises in SCOM/ SCE & PRO ID Tip in SCVMM Schweregrad Ursache des Warnhinweises Im Dell PRO Tip empfohlene Störungsbeseitigungsmaßnahme 2057 Warnung Warnung zur Herabsetzung einer virtuellen Festplatte. Diese Warnmeldung Einschränken tritt auf, wenn eine physische Festplatte, die Teil einer redundanten virtuellen Festplatte ist, fehlerhaft ist.
Tabelle 3-1. Ursache des Warnhinweises und Wiederherstellungsmaßnahme (fortgesetzt) Beschreibung des DellEreignis- Warnhinweises in SCOM/ SCE & PRO ID Tip in SCVMM Schweregrad Ursache des Warnhinweises Im Dell PRO Tip empfohlene Störungsbeseitigungsmaßnahme Temperatur fiel auf Warnung einen Wert unterhalb des minimalen Warnungsschwellen werts ab. Das Gehäuse der physischen Festplatte ist zu kühl. 2102 Kritisch Temperatur hat maximalen Fehlerschwellenwert überschritten.
Tabelle 3-1. Ursache des Warnhinweises und Wiederherstellungsmaßnahme (fortgesetzt) Beschreibung des DellEreignis- Warnhinweises in SCOM/ SCE & PRO ID Tip in SCVMM 2123 2125 Schweregrad Redundanz verloren Warnung Controller-Cache festgesetzt für fehlende oder Offline-VD Warnung Ursache des Warnhinweises Bei einer virtuellen Festplatte oder einem Gehäuse ist die Datenredundanz verloren gegangen.
Tabelle 3-1. Ursache des Warnhinweises und Wiederherstellungsmaßnahme (fortgesetzt) Beschreibung des DellEreignis- Warnhinweises in SCOM/ SCE & PRO ID Tip in SCVMM Schweregrad Ursache des Warnhinweises Im Dell PRO Tip empfohlene Störungsbeseitigungsmaßnahme Die Zimmertemperatur ist eventuell zu hoch. Der Systemlüfter kann außerdem herabgesetzt oder fehlerhaft sein. Einschränken 2171 Die Temperatur der Warnung Controller-Batterie ist höher als normal.
Tabelle 3-1. Ursache des Warnhinweises und Wiederherstellungsmaßnahme (fortgesetzt) Beschreibung des DellEreignis- Warnhinweises in SCOM/ SCE & PRO ID Tip in SCVMM Schweregrad Ursache des Warnhinweises Im Dell PRO Tip empfohlene Störungsbeseitigungsmaßnahme 2203 Ein dedizierter Hotspare ist ausgefallen Warnung Der Controller ist nicht in der Lage, mit einer Einschränken Festplatte zu kommunizieren, die als dedizierter Hotspare zugewiesen wurde.
Tabelle 3-1. Ursache des Warnhinweises und Wiederherstellungsmaßnahme (fortgesetzt) Beschreibung des DellEreignis- Warnhinweises in SCOM/ SCE & PRO ID Tip in SCVMM Schweregrad Ursache des Warnhinweises 2246 Die ControllerBatterie ist herabgesetzt. Warnung Die Temperatur der Batterie ist hoch. Dies Einschränken kann daran liegen, dass die Batterie aufgeladen wird. 2264 Ein Gerät fehlt Warnung Der Controller kann nicht mit einem Gerät Einschränken kommunizieren.
Tabelle 3-1.
Tabelle 3-1. Ursache des Warnhinweises und Wiederherstellungsmaßnahme (fortgesetzt) Beschreibung des DellEreignis- Warnhinweises in SCOM/ SCE & PRO ID Tip in SCVMM Schweregrad Ursache des Warnhinweises 2292 Die Kommunikation mit dem Gehäuse ist verloren gegangen Kritisch Die Kommunikation Einschränken und zwischen dem Controller und einem Migrieren Gehäusemanagement modul (EMM) ist verloren gegangen. Die Kabel sind möglicherweise lose oder defekt.
Tabelle 3-1. Ursache des Warnhinweises und Wiederherstellungsmaßnahme (fortgesetzt) Beschreibung des DellEreignis- Warnhinweises in SCOM/ SCE & PRO ID Tip in SCVMM Schweregrad Ursache des Warnhinweises Im Dell PRO Tip empfohlene Störungsbeseitigungsmaßnahme 2301 Fehler der Gehäusehardware Kritisch Das Gehäuse oder eine Gehäusekomponente Einschränken und befindet sich in einem Migrieren fehlerhaften oder herabgesetzten Zustand.
Tabelle 3-1. Ursache des Warnhinweises und Wiederherstellungsmaßnahme (fortgesetzt) Beschreibung des DellEreignis- Warnhinweises in SCOM/ SCE & PRO ID Tip in SCVMM Schweregrad Ursache des Warnhinweises 2310 Eine virtuelle Festplatte ist dauerhaft herabgesetzt Kritisch Bei einer redundanten virtuellen Festplatte ist Einschränken und die Redundanz verloren Migrieren gegangen. Dies kann vorkommen, wenn bei der virtuellen Festplatte mehrere physische Festplatten ausfallen.
Tabelle 3-1. Ursache des Warnhinweises und Wiederherstellungsmaßnahme (fortgesetzt) Beschreibung des DellEreignis- Warnhinweises in SCOM/ SCE & PRO ID Tip in SCVMM Schweregrad Ursache des Warnhinweises Im Dell PRO Tip empfohlene Störungsbeseitigungsmaßnahme 2319 Single-Bit-ECCFehler auf Controller-DIMM. Warnung Das Speichermodul Einschränken und mit zwei Kontaktanschlussreihe Migrieren n (DIMM) beginnt, nicht mehr richtig zu funktionieren. 2320 Single-Bit-ECCFehler.
Tabelle 3-1. Ursache des Warnhinweises und Wiederherstellungsmaßnahme (fortgesetzt) Beschreibung des DellEreignis- Warnhinweises in SCOM/ SCE & PRO ID Tip in SCVMM Schweregrad Ursache des Warnhinweises Im Dell PRO Tip empfohlene Störungsbeseitigungsmaßnahme 2324 Kritisch Das Wechselstromnetzk abel wurde entfernt. Das Stromkabel wurde Einschränken und abgezogen oder Migrieren entfernt. Es ist auch möglich, dass das Stromkabel zu warm geworden ist und verbogen und funktionsuntüchtig geworden ist.
Tabelle 3-1. Ursache des Warnhinweises und Wiederherstellungsmaßnahme (fortgesetzt) Beschreibung des DellEreignis- Warnhinweises in SCOM/ SCE & PRO ID Tip in SCVMM Schweregrad Ursache des Warnhinweises 2337 Kritisch Der Controller war nicht in der Lage, Daten aus dem Cache wiederherzustellen. Der Controller ist nicht in der Lage, zwischengespeicherte Daten von der BatterieBackupeinheit (BBU) wiederherzustellen.
Tabelle 3-1.
Verwendung von Dell PRO Pack 47