Users Guide

contrôleurs (si elle est opérationnelle) alimente la mémoire DRAM lors d’une coupure d’alimentation afin que le contenu puisse être
copié dans la mémoire Flash pour un stockage indéfini.
Le contenu de la mémoire cache peut être réparti pour l’essentiel en trois parties :
Configuration et métadonnées RAID : informations sur les matrices RAID, notamment les informations de configuration, les membres
des disques, le rôle des disques, etc.
Logs de contrôleurs : les contrôleurs RAID gèrent plus fichiers logs. Les techniciens Dell s’appuient sur le log TTY en tant que log
principal pour résoudre divers problèmes RAID et de disques durs.
Données RAID : il s’agit des données réelles destinées à être écrites sur les disques durs individuels. Les données sont écrites dans la
mémoire cache du contrôleur dans les modes Mémoire cache à écriture différée et Mémoire cache à double écriture.
Découpage
La configuration de plusieurs matrices RAID dans un seul et même ensemble de disques est appelée découpage.
Défaillance RAID
Une défaillance RAID est une fonction du contrôleur RAID PowerEdge (PERC) Dell conçue pour permettre au contrôleur de restaurer la
redondance de la matrice malgré la perte de données causée par une condition de double panne. La défaillance RAID est également
appelée reconstruction avec erreurs. Si le contrôleur RAID détecte une double panne et que la redondance est insuffisante pour restaurer
les données dans la bande concernée, le contrôleur crée une défaillance dans cette bande et permet à la reconstruction de se poursuivre.
La double panne est une condition qui entraîne l’inaccessibilité des données dans une même bande sur plusieurs lecteurs.
Les doubles pannes entraînent la perte de toutes les données au sein de la bande impactée.
Toutes les défaillances RAID sont des doubles pannes, mais les doubles pannes ne sont PAS des défaillances RAID.
Matrice RAID ponctionnée : causes
Sans la fonction de ponction RAID, la reconstruction de la matrice ne fonctionnerait pas et la laisserait dans un état dégradé. Dans certains
cas, les pannes peuvent entraîner la défaillance d’autres disques, et faire passer la matrice dans un état hors ligne non opérationnel. La
ponction d’une matrice n’a aucun impact sur son démarrage ou sur l’accès aux données qu’elle contient.
Les ponctions RAID peuvent se produire dans l’une de ces deux situations :
Une double panne est déjà en cours (données déjà perdues).
Une erreur de données sur un disque en ligne s’est propagée (copiée) sur un disque en reconstruction.
La double panne n’est pas survenue (les données sont perdues au moment de la deuxième erreur).
À l’état dégradé, si un disque en ligne présente un bloc défectueux, cette adresse de bloc logique est ponctionnée de la matrice RAID.
L’avantage de ponctionner une matrice est de maintenir la disponibilité du système en production jusqu’au rétablissement de la redondance
de la matrice. Les données de la bande affectée sont perdues, que la matrice RAID soit ponctionnée ou non. L’inconvénient principal de
cette méthode, c’est que pendant que la matrice RAID est ponctionnée, des erreurs irrémédiables continueront de se produire à chaque
accès aux données concernées (le cas échéant).
Une ponction RAID peut se produire aux trois emplacements suivants :
Dans un espace vide ne contenant aucune donnée. Cette bande sera inaccessible, mais comme aucune donnée ne s’y trouve, cela
n’aura aucun impact significatif. Toute tentative d’écriture par un système d’exploitation sur une bande faisant l’objet d’une ponction
RAID se produira à un autre emplacement.
Dans une bande contenant des données non stratégiques comme un fichier README.TXT. Si rien ni personne n’accède aux données
concernées, aucune erreur n’est générée pendant les opérations d’E/S normales. Les tentatives de sauvegarde du système de fichiers
se solderont par l’échec de la sauvegarde des fichiers concernés par une ponction RAID. L’exécution d’une vérification de cohérence
ou d’opérations de lecture cohérente généreront le code d’analyse : 3/11/00 pour la LBA et/ou les bandes concernées.
Dans un espace de données auxquelles des personnes et des processus accèdent. Dans un tel cas, les données perdues peuvent
provoquer diverses erreurs. Il peut s’agir d’erreurs mineures n’ayant aucune incidence sur l’environnement de production. Mais il peut
également s’agir d’erreurs plus graves pouvant empêcher le système de démarrer sur un système d’exploitation ou pouvant entraîner la
défaillance des applications.
Une matrice RAID ponctionnée finira par devoir être supprimée et recréée afin d’éliminer cette ponction RAID. Cette procédure entraîne la
suppression de l’intégralité des données. Il faut alors recréer ou restaurer toutes les données à partir d’une sauvegarde après l’élimination
94
Dépannage des problèmes matériels