Users Guide

Cache-Nutzung
Hardware-RAID Controller nutzen Cache (ein temporäres Informationsrepository) für den Normalbetrieb. Der Cache für den
Normalbetrieb umfasst DRAM-Speicher, wie Systemspeicher, und bewahrt Daten nur auf, wenn das System eingeschaltet ist.
Neuere Controller nutzen NVCache, der verwendet wird, wenn der Server ausgeschaltet ist. NVCache-Speicher umfasst sowohl
DRAM-Speicher (für den Normalbetrieb) als auch Flash-Speicher (nicht üchtig). Der Controller-Akku (falls in Betrieb) versorgt den
DRAM-Speicher bei einem Stromausfall mit Strom, sodass der Inhalt für dauerhafte Aufbewahrung in den Flash-Speicher kopiert
werden.
Der Inhalt des Cache kann im Wesentlichen in drei Kategorien unterteilt werden:
RAID-Konguration und Metadaten: Informationen über die RAID-Arrays einschließlich Kongurationsinformationen,
Datenträgermitglieder, Rolle der Laufwerke usw.
Controller-Protokolle: RAID-Controller enthalten mehrere Protokolldateien. Dell Techniker verwenden das TTY-Protokoll als primäres
Protokoll für das Troubleshooting bei verschiedenen RAID- und Festplattenproblemen.
RAID-Daten: Dies sind die tatsächlichen Daten, die auf die einzelnen Festplatten geschrieben werden sollen. Daten werden in den Cache
des Controllers sowohl im Durchschreib- als auch im Rückschreib-Cachingrichtlinienmodus geschrieben.
Slicing
Die Konguration mehrerer RAID-Arrays über den gleichen Satz von Festplatten wird als Slicing bezeichnet.
RAID-Funktion für defekte Datenblöcke
Die RAID-Funktion für defekte Datenblöcke ist eine Funktion des Dell PowerEdge RAID Controllers (PERC) und ermöglicht es dem
Controller, eine Redundanz des Arrays trotz Datenverlust durch einen zweifachen Fehler wiederherzustellen. Eine andere Bezeichnung für
die RAID-Funktion für defekte Datenblöcke ist Neuerstellung mit Fehlern. Wenn der RAID-Controller einen zweifachen Fehler und
unzureichende Redundanz für die Wiederherstellung der Daten im betroenen Block feststellt, erstellt der Controller eine „Punktionsstelle
in diesem Datenblock und ermöglicht die Fortsetzung der Neuerstellung.
Bei jeder Bedingung, die dazu führt, dass kein Zugri auf Daten in dem gleichen Datenblock auf mehr als einem Laufwerk möglich ist,
handelt es sich um einen zweifachen Fehler.
Zweifache Fehler führen zum Verlust aller Daten in dem betroenen Datenblock.
Alle RAID-Punktionsstellen sind zweifache Fehler, nicht alle zweifachen Fehler sind jedoch RAID-Punktionsstellen.
Ursachen für RAID-Löcher
Ohne die Funktion „RAID Puncture“ (RAID-Loch) würden Array-Rebuilds fehlschlagen und das Array würde heruntergestuft. In manchen
Fällen könnte ein solches Fehlschlagen dazu führen, dass weitere Laufwerke ausfallen und das Array funktionsunfähig wird (Status
Oine“). RAID-Löcher auf Arrays haben keine Auswirkungen auf den Array-Start. Auch der Zugri auf die auf dem Array gespeicherten
Daten ist weiterhin möglich.
RAID-Löcher können in zwei Situationen gesetzt werden:
Es wurde ein doppelter Ausfall erkannt (d. h., es sind bereits Daten verloren gegangen).
Ein Datenfehler auf einem online geschalteten Laufwerk wird auf ein Laufwerk kopiert, auf dem gerade ein Rebuild durchgeführt wird.
Es wurde kein doppelter Ausfall erkannt (d. h., es kommt erst beim zweiten Fehler zu Datenverlust).
Wenn auf einem online geschalteten Laufwerk im Status „Degraded“ (Heruntergestuft) ein fehlerhafter Block erkannt wird, wird an der
betreenden LBA ein RAID-Loch gesetzt.
Der Vorteil eines Array-Lochs besteht darin, dass das System für die Produktion verfügbar bleibt, bis die Redundanz des Arrays
wiederhergestellt werden kann. Die Daten im betroenen Stripe gehen immer verloren, gleich ob ein RAID-Loch gesetzt wird oder nicht.
110
Beheben von Hardwareproblemen