Users Guide

RAID 펑처
RAID 펑처는 컨트롤러가 이중 장애 상태로 인한 데이터 손실에도 불구하고 어레이의 이중화를 복원하도록 설계한 Dell
PERC(PowerEdge RAID Controller) 기능입니다. RAID 펑처는 '오류와 함께 재구축'으로 불리기도 합니다. RAID 컨트롤러가 이중
애를 감지하고 영향을 받은 스트라이프에 데이터를 복구할 만큼 이중화가 충분하지 않다면 컨트롤러가 해당 스트라이프에 펑처를
성하며 재구축이 계속되도록 합니다.
이상 드라이브의 동일한 스트라이프에서 데이터가 액세스할 없게 되는 모든 상태가 이중 장애입니다.
이중 장애는 영향을 받은 스트라이프 모든 데이터의 손실을 유발합니다.
모든 RAID 펑처는 이중 장애이지만, 모든 이중 장애가 RAID 펑처인 것은 아닙니다.
RAID 펑처의 원인
RAID 펑처 기능이 없다면 어레이 재구축이 실패하고 어레이가 성능 저하 상태가 됩니다. 어떤 경우에는 장애가 추가 드라이브에 장애
일으키고 어레이가 작동하지 않는 오프라인 상태가 되도록 만듭니다. 어레이 펑처는 부팅 기능이나 어레이의 모든 데이터에 대한
액세스에 아무런 영향을 미치지 않습니다.
RAID 펑처는 2개의 상황 하나에서 발생할 있습니다.
Double Fault(이중 장애) 이미 존재합니다(이미 손실된 데이터).
온라인 드라이브의 데이터 오류가 재구축 드라이브로 전파(복사)되었습니다.
Double Fault(이중 결함) 존재하지 않습니다( 번째 오류 발생 데이터가 손실됨).
성능 저하 상태인 온라인 드라이브에서 불량 블록이 발생하면 해당 LBA RAID 펑처된 것입니다.
어레이 펑처의 이점은 어레이의 이중화가 복원될 때까지 시스템의 생산성을 유지하는 것입니다. 영향을 받은 스트라이프의 데이
터는 RAID 펑처 발생 여부와 관계없이 손실됩니다. 방법의 주된 단점으로, 어레이에 RAID 펑처가 있는 영향을 받은 데이터(있는
경우) 액세스될 때마다 수정할 없는 오류가 지속적으로 발생합니다.
RAID 펑처는 다음 가지 위치에 발생할 있습니다.
데이터가 없는 공간. 해당 스트라이프는 액세스할 없지만, 위치에 데이터가 없으므로 영향을 미치지 않습니다. OS
RAID 펑처된 스트라이프에 쓰려고 때마다 장애가 발생하고 데이터가 다른 위치에 기록됩니다.
README.TXT 파일처럼 중요하지 않은 데이터가 있는 스트라이프. 영향을 받은 데이터에 액세스할 없다면 정상적인 I/O
류가 생성되지 않습니다. 파일 시스템 백업을 시도하면 RAID 펑처에 영향을 받은 모든 파일의 백업에 실패합니다. Check
Consistency(정합성 검사) 또는 Patrol Read(순회 읽기) 작업을 수행하면 적용 가능한 LBA 또는 스트라이프에 대한 감지
: 3/11/00 생성됩니다.
이는 액세스된 데이터 공간에서 이루어집니다. 이러한 경우 손실된 데이터가 다양한 오류를 일으킬 있습니다. 해당 오류는
로덕션 환경에 부정적인 영향을 미치지 않는 사소한 오류일 있습니다. 심각한 오류일 수도 있으며 시스템이 운영 체제로
팅하지 못하게 방지하거나 애플리케이션에 장애가 발생하도록 있습니다.
RAID 펑처가 발생한 어레이는 결국 삭제되어야 하며 해당 RAID 펑처를 제거하기 위해 다시 생성해야 합니다. 절차로 인해 모든
이터가 삭제됩니다. 그러면 RAID 펑처가 삭제된 해당 데이터를 다시 생성하거나 백업에서 복원해야 합니다. RAID 펑처에 대한
결은 비즈니스의 요구 사항에 이로운 시기에 예약될 있습니다.
RAID 펑처된 스트라이프에 있는 데이터가 액세스되었다면 수정할 없는 불량 LBA 대해 오류가 계속 보고됩니다. 결국(, , ,
등의 단위가 있음) BBM(Bad Block Management) 표가 채워져 하나 이상의 드라이브가 예상되는 장애로 플래그 지정됩니다.
그림에 보이듯이 전파되고 있는 드라이브 1 드라이브 2 오류로 인해 드라이브 0 일반적으로 예상되는 장애로 플래그 지정됩니
. 드라이브 0 실제로 정상 작동할 있고, 드라이브 0 교체하면 해당 교체 또한 결국 예상되는 장애로 플래그되도록 있습
니다.
RAID 펑처가 유발된 수행된 Check Consistency(정합성 검사) 문제를 해결하지 않습니다. 이는 정기적으로 Check Consistency(
합성 검사) 수행해야 하는 아주 중요한 이유입니다. 가능한 경우 드라이브를 교체하기 전에 이렇게 하는 것이 특히 중요합니다.
Check Consistency(정합성 검사) 수행하려면 어레이가 최적 상태여야 합니다.
하드 드라이브 장애 같은 추가적인 오류 이벤트와 함께 단일 데이터 오류가 있는 RAID 어레이는 장애가 발생한 또는 교체 드라이브가
어레이에 재구축되었을 RAID 펑처를 일으킵니다. 예를 들어, 최적 상태인 RAID 5 어레이에 드라이브 0, 드라이브 1 드라이브 2
멤버가 포함되어 있습니다. 드라이브 0 장애가 발생하여 교체되면 드라이브 1 2 남아 있는 데이터와 패리티가 교체 드라이
0 누락된 정보를 재구축하는 사용됩니다. 하지만 재구축 작업이 해당 오류에 도달할 드라이브 1 데이터 오류가 존재한다
스트라이프의 누락된 데이터를 재구축할 정보가 스트라이프 내에 충분하지 않게 됩니다. 드라이브 0에는 데이터가 없고, 드라이브
1에는 불량 데이터가 있으며, 드라이브 2에는 재구축되며 양호한 데이터가 있습니다. 해당 스트라이프 내에는 여러 오류가 있습니다.
드라이브 0 드라이브 1에는 유효한 데이터가 포함되어 있지 않으므로 해당 스트라이프의 모든 데이터가 복구되지 못하여 결국
실됩니다. 그림 3 표시된 결과처럼 RAID 펑처(스트라이프 1 2 ) 재구축 생성됩니다. 해당 오류는 드라이브 0으로 전파됩
니다.
84 하드웨어 문제 해결