[스토리지] RAID(Redundant Array of Independent Disk) 구성
꾸적꾸적
2025. 4. 15. 23:06
RAID(Redundant Array of Independent Disk, 복수 배열 독립 디스크)
여러개의 저장장치를 묶어 하나의 고용량 고성능 저장장치와도 같은 효과를 얻기 위해 개발된 기술
RAID 의 목적
1. 여러개의 디스크 모듈을 하나의 대용량 디스크처럼 사용할 수 있도록 한다.(RAID 0)
2. 여러개의 디스크 모듈에 데이터를 나눠 한번에 쓰고 한번에 읽는 방식으로 입출력 속도를 높임
3. 여러개의 디스크를 모아 하나의 대용량 디스크로 만들고,
하나 또는 둘 이상의 디스크에 장애가 발생하더라도 데이터가 사라지는 것을 방지한다.(RAID 5, 6)
RAID의 종류
0부터 6까지 총 7가지가 있지만 주로 사용하는 레벨은 0, 1, 5, 6, 0+1, 1+0 이다.
RAID 0, 스트라이프
두개 이상의 디스크를 하나처럼 사용하는 기술로,
RAID 구성에서 가장 기본적인 구성 방법을 의미하며,
해당 기술이 이후 RAID 구성의 기초가 된다.
특징
1. 디스크를 병렬로 배치하여 거대한 하나의 디스크처럼 사용한다.
2. 데이터 입출력이 각 디스크에 공평하게 분배된다.
3. 디스크의 수가 N이라고 가정하면, 입출력 속도는 N배 증가한다.
4. 디스크 하나의 용량이 X라고 가정한다면, 총 가용 용량은 N*X가 된다.
단점
1. 하나의 디스크가 고장난다면 모든 데이터가 사용 불가능 상태가 된다.
2. 오류검출 기능이 없어 디스크를 늘릴수록 안정성이 떨어진다.
RAID1, 미러링
최소 두개 이상의 디스크를 사용해야하며,
RAID 0처럼 추후 나오는 RAID 구성에서 해당 미러링 기술이 사용된다.
두 디스크를 완전히 동일하게 구성하는 기술. 쉽게 비유하자면 동기화를 의미한다.
즉, 똑같은 데이터를 가진 두 디스크를 만든다는 의미인데, 이를 통해 복구 능력을 제공한다.
특징
1. 최소 2개 이상의 디스크를 필요로 한다.(보통 2의 배수로 사용한다.)
2. 디스크의 수에 관련없이 입출력 속도는 동일하다.
3. 디스크 하나의 용량이 X라고 가정한다면, 총 가용 용량은 X가 된다.
단점
1. 특징 3과 동일한 이야기이지만, 디스크를 2개를 씀에도 불구하고 하나만 사용가능하다.
2. 가용용량이 적어 여러 디스크를 사용해야하므로 가격이 비싸다.
RAID 0+1, RAID 1+0
RAID 0+1, 1+0은 순서가 다른데,
RAID 0+1은 먼저 RAID 0으로 속도를 올린 두 개 이상의 디스크를 RAID 1을 통해 복제하는 것이고,
RAID 1+0은 먼저 RAID 1로 복제된 두개 이상의 디스크를, RAID 0을 통해 복제하는 것이다.
즉, 순서에 따라 다르다는 말인데, 이건 어느 부분에서 속도가 빠르냐라는 의미가 된다.
RAID 0+1은 데이터의 입출력 속도가 빠른 대신, 복제하는 속도가 느리고,
RAID 1+0은 복제 속도는 빠르지만, 데이터의 입출력 속도가 느리다.
RAID2, RAID3, RAID4
RAID 2, 3, 4는 해밍코드와 패리티비트라는 개념이 등장한다. 해밍코드와 패리티비트는 디스크가 손상될 경우, 에러체크 및 수정을 지원하는 기능이다.
RAID 2에서 사용되는 해밍코드는 ECC(Error Correction Code)를 별도의 디스크에 저장하는 방식으로 처리되는데, 이 디스크가 손상된다면 문제가 발생할 수 있으므로, 사장된 기술이다.
* ECC(Error Correction Code, 해밍코드) : 1940년대 벨 연구소의 해밍이 개발한 컴퓨터가 정보를 송수신할때, 오류를 검출하고 정정할 수 있는 방법 종류로는 Repetition(반복), Redundancy(잉여 정보), Hamming ECC, Checksum 으로 4가지 방식이 존재하는데, 이건 추후 게시글로 정리.
RAID 3, 4는 해밍코드를 대신하여 패리티비트라는 기술을 사용하는데, RAID 3은 바이트 단위로, RAID 4는 블록 단위로 하나의 디스크를 통째로 패리티비트 디스크로 사용한다.
RAID5
RAID 4의 패리티비트를 하나의 디스크에 저장하여 오류가 나면 전체가 문제가 생긴다는 단점을 보완한
패리티 데이터 분산 저장 방식을 채용한 가장 일반적인 보안 RAID 수준을 의미한다.
특징
1. 최소 3개 이상의 디스크를 사용해야한다.
2. 패리티비트를 하나의 디스크에 밀어넣지 않고 각 멤버디스크에 순환 저장하여 입출력 병목현상을 해결함.
3. N개의 디스크를 사용하면 (N-1)배의 가용 공간을 사용할 수 있다.
4. 하나의 디스크가 고장나더라도 다른 디스크들을 통해 복구가 가능함
단점
1. 두개 이상의 디스크가 고장난다면, 복구가 불가능하다.
2. 패리티비트를 나누어 저장한다지만, 결국 하나의 디스크 공간 만큼을 사용하기에 비용이 더 들어간다.
RAID6
RAID 5의 단점이었던, 둘 이상의 디스크가 오류가 나면 복구가 불가능하다는 단점을 보완한 방식으로, 패리티 데이터를 두개 저장하는 방식을 채용한 현재 가장 강력한 보안 RAID 수준을 의미한다.
특징 1. 최소 5개 이상의 디스크를 사용해야한다. 2. 패리티비트를 하나의 디스크에 밀어넣지 않고 각 멤버디스크에 순환 저장하여 입출력 병목현상을 해결함. 3. N개의 디스크를 사용하면 (N-2)배의 가용 공간을 사용할 수 있다. 4. 최대 두 개의 디스크가 동시에 고장나더라도 다른 디스크들을 통해 복구가 가능함
단점 1. 말 그대로 최소 디스크의 개수가 많이 필요하므로 가격이 비싸다. 2. 1의 단점에 이어 5개의 디스크를 사용하더라도 가용 공간은 3개밖에 안되므로 가격이 비싸다.