IT Technology

재해복구(DR : Disaster Recovery)이란?

by빵수 2022. 10. 17. 14:40
728x90
반응형

재해복구시스템에 대해서 알아보자.

 

 

재해복구(DR :  Disaster Recovery)

  • 각종 재해 및 위험요소에 의해 정보시스템이 중단됐을 때 이를 정상으로 회복시키는 것을 의미한다.
  • 영어 약자인 디알(DR)이라고 하는 경우가 많다.
  • IT에서의 재해는 사전적 의미를 벗어나 지진, 태풍, 홍수, 화재 등의 자연재해 및 테러로 인한 폭파, 전쟁, 해킹, 통신장애, 전력공급 차단 등 외부요인에 의한 재해, 그리고 시스템 결함, 기계적 오류, 관리정책 오류, 사용자 실수 같은 내부적 요인에 의한 장애 등 다양한 사례를 포함한다.

 

재해복구 시스템

 

유형

 

구축 형태별 구분

  • 독자 구축 : 재해복구 시스템을 독자적으로 구축하는 방식으로, 보안 유지 및 복구의 신뢰성이 가장 높으나, 구축 및 유지비용이 가장 많이 소요된다. 비교적 규모가 큰 금융기관 등에서 주로 채택하고 있는 방식이다.
  • 공동구축 : 두 개 이상의 기관이 재해복구시스템을 공동으로 이용하는 방식이다. 비용 측면에서 독자 구축의 경우보다 적게 소요되지만 보안과 운용 측면에서는 고려할 사항이 많고, 광역 재해 발생 시 공동이용기관 간의 동시 재해복구가 불가능하다는 단점이 있다. 이 방식에서는 공동이용기관의 합의가 매우 중요하다.
  • 상호구축 : 별도의 재해복구 시스템을 구축하는 대신, 두 개 이상의 기관이 상호 간의 재해복구시스템의 역할을 수행하거나, 단일 기관이 여러 개의 정보시스템 사이트를 가지고 있는 경우에는 사이트 상호간에 서로 재해복구센터의 역할을 수행하도록 하는 방식이다. 구축 및 운영비용이 저렴한 장점이 있으나 서로 다른 기관과 이러한 방식의 재해복구시스템을 구축하는 경우 보안성 및 재해복구에 대한 신뢰성이 대단히 낮다.

운영 주체별 구분

  • 자체 운영 : 기관 자체의 인력으로 재해복구시스템을 운영하는 방식이다. 보안성 및 신뢰성이 가장 높으나, 재해복구를 위한 추가의 인력이 확보되어야 하며 운영비용이 높다. 일반적으로 독자 구축형 재해복구센터에서 사용되는 운영방식이다.
  • 공동운영 : 두 개 이상의 기관이 재해복구 시스템의 운영인력을 상호 공유하는 방식이다. 일반적으로 공동구축형 또는 상호구축형 재해복구시스템에서 사용되는 운영방식이다. 자체 운영에 비해 운영비용을 절감할 수 있으나, 기관 간 신뢰가 전제되어야 하고, 보안성 유지를 위한 협의가 중요하다.
  • 위탁운영 : 재해복구시스템의 운영을 민간 IDC 운영자 등 외부의 다른 기관에 위탁하는 방식이다. 정보시스템 운영기관의 보안성 유지가 가장 큰 문제로 대두되나, 위탁 운영 업체의 보안 유지에 대한 신뢰성이 높다면 전문적인 재해복구 서비스를 제공받을 수 있으며 초기 투자 비용이 적게 드는 장점이 있어, 최근 사용이 증가하는 추세에 있다. 미국의 대형 금융기관 및 공공기관 등에서 이러한 형태의 사용 예를 볼 수 있다.

복구 수준별 유형

  • 미러 사이트(Mirror Site) : 주요 운영 시스템 DMBS에 대한 실시간 미러링으로 주 센터와 백업센터 간 동일한 시스템 이미지 구성 및 데이터 손실이 없어 재해/장애 발생 시에도 영향이 없는 복제 시스템을 구성한다. 또한 주 센터 및 백업센터 간 네트워크 이중화 구성을 통해 신속한 복구가 가능하다. 말단 사용자는 장애 상황을 알 수가 없다.
  • 핫 사이트(Hot Site) : 미러 사이트와 거의 동일한 방식이나 시설 측면에서 완벽한 이중화는 아니고, 주 센터와 백업센터 간의 DB를 직접 이중화하는 방안이다. 백업센터에서 LOG를 적용하여 DB를 갱신하는 시간이 소요된다.
  • 웜 사이트(Warm Site) : 주기적으로 시스템 및 데이터 백업 테이프를 로컬이나 원격지에 보관 및 소산 하는 방식으로 전통적인 백업 방식이다. 저비용 구성이 가능하고 대부분의 테이프(TAPE) 및 디스크(DISK) 백업 방식이 여기에 속한다.
  • 콜드 사이트(Cold Site) : 주요 업무에서 발생하는 데이터, 원격지 배치(Batch) 형 작업 및 비실시간 백업으로 처리한다.

 

구현 기술

H/W적 복제 방식

  • 디스크 장치를 이용한 복제 : 자료가 최종적으로 저장되는 디스크를 복제 대상으로 하여, 사용 중인 원본 디스크를 원거리 지역의 복구용 디스크로 복제하는 방식이 바로 디스크 수준의 복제 방식이다. 주 센터의 원본 디스크와 재해복구센터의 복구용 디스크는 기본적으로 마이크로코드(Microcode 2) 수준에서 완벽한 호환성을 제공하여야 하지만, 디스크에 별도의 가상화 솔루션 등을 활용한다면 이기종 디스크 간에도 복제가 가능하다. 디스크 장치를 이용한 복제 방식의 구성 시, 최초에는 디스크 전체를 대상으로 복제 작업을 수행하므로 많은 시간이 소요되나, 이후 운영 시에는 디스크의 변경 분만을 복제하므로, 고속 복제가 가능하다.

S/W적 복제 방식

  • 운영체제를 이용한 복제 : 데이터를 디스크에 저장, 관리하기 위한 논리적인 볼륨을 만들어 사용한다. 즉, 데이터는 논리적 볼륨에서 관리, 전송되어 이것이 물리적 디스크에 저장되는 것이다. 운영체제를 이용한 복제 방식은 서버에서 디스크로 데이터를 전송하고 저장하는 중간 단계에서 데이터 블록을을 복제하여 재해복구센터로 보내는 방식이다. 따라서 운영체제를 이용한 복제 방식에는 주 센터와 재해복구센터의 양쪽 서버에 데이터의 복제를 관리하기 위한 동일한 복제솔루션을 설치하여야 한다. 복제솔루션은 해당 서버 자체에서 수행되거나, 별도의 디스크 관리 서버 자원을 사용하여 수행될 수 있다. 그러므로 재해복구시스템 구축 시 기존의 운영환경의 용량 및 부하를 고려하여 서버 자원의 적정성을 검토하여야 한다. 일반적으로 중간 정도의 성능과 용량의 디스크를 사용하거나, 이기종 디스크를 사용하는 운영환경에서 재해복구시스템을 구축하는 경우에 주로 사용된다.
  • DBMS를 이용한 복제 방식 : 주 센터의 DBMS(Database Management System)에서 사용되는 SQL(Structured Query Language)문 혹은 변경 로그를 원격 사이트의 DBMS에 전송하여 복제하는 방식이다. 주 센터와 재해복구센터의 DBMS 및 복제 솔루션이 동일해야 하며, 디스크, 논리적 볼륨 및 플랫폼의 종류가 다르더라도 구현이 가능하다. 또한, DBMS를 이용한 복제 솔루션은 주 센터와 재해복구센터 서버의 자원을 사용하여 동작하므로 서버 자원의 증설을 검토하여야 한다.

데이터 전송 방식

데이터 복구 시스템에서는 데이터 복제 방식과 더불어 데이터 전송 방식을 알맞게 혼합하여 현 시스템과 재해복구 수준에 최적화된 재해복구 시스템을 구축하는 것이 중요하다. 하지만, 주 센터 운영시스템에서의 실수나 오류로 인한 잘못된 데이터의 추가 및 변경도 재해복구센터에 동일하게 복제되어 주 센터의 논리적 데이터 오류에 의한 장애 시 원격지에서도 동일한 장애가 발생하게 된다. 따라서 재해복구 시스템만 구축되면 모든 장애와 재해를 막을 수 있는 것은 아니다.

Sync(동기 복제)

Sync 방식은 어떠한 상황에서도 완벽한 데이터 복구를 보장하여 준다. 이 방식은 사용자 혹은 작업이 주 센터의 운영 시스템에서 데이터를 추가 혹은 변경하였을 경우 주 센터뿐 아니라 재해복구센터에서도 정상적으로 추가 혹은 변경이 완료되었다는 것을 시스템에서 확인한 후에 사용자 혹은 직업에 추가 혹은 변경 완료 신호를 보내게 되는 방식이다. 따라서 주 센터와 재해복구센터 간의 데이터 정합성은 항상 유지되므로 가장 안전하고 신뢰성이 높은 방식이다. 그러나, 주 센터와 재해복구센터 간을 연결하는 고속의 회선이 필요하다. 왜냐하면, 주 센터뿐 아니라 재해복구센터에 있는 데이터 역시 빠른 시간 내에 추가, 변경하여야 응답속도의 지연을 막아 기존의 서비스 수준을 유지할 수 있기 때문이다. 결국 이러한 요구는 고속회선을 위한 많은 회선 비용과 주 센터와 재해복구센터 간의 거리 제한을 가져올 수 있다. 또한 주 센터와 재해복구센터 간의 회선 장애 혹은 재해복구 시스템의 장애 및 운영 실수는 즉시 주 센터의 운영 시스템에도 영향을 미치어 서비스 장애로 이어질 수 있다. 따라서 재해복구시스템 유지 관리의 어려움과 운영 수준 유지를 위한 인력, 비용이 추가로 발생하게 된다.

ASync(비동기 복제)

ASync 방식의 가장 큰 특징은 Sync 방식과 달리 재해복구 시스템을 구축하여 데이터를 복제하더라도 기존 운영 서비스의 성능에 거의 영향을 주지 않는다는 것이다. 재해복구시스템을 Async 방식으로 구축하면 기존 운영 서비스는 기존과 동일하게 동작하고, 데이터 복제는 기존 운영 시스템의 서비스와는 별도로 디스크, 서버 및 DbMS 수준의 전송방식에 따라 운영 서비스 이후 독립적으로 동작한다. 즉, 데이터 복제를 수행하기는 하나 그것이 언제 수행되는지는 재해복구를 위한 시스템의 환경 및 여러 조건에 따라 정해진다. 하지만, Sync 방식보다 비해 현시점에서 운영시스템의 100% 데이터 복제를 보장하지는 못한다.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

출처

http://wiki.hash.kr/index.php/%EC%9E%AC%ED%95%B4%EB%B3%B5%EA%B5%AC#.EC.9E.AC.ED.95.B4.EB.B3.B5.EA.B5.AC.EC.8B.9C.EC.8A.A4.ED.85.9C

반응형

'IT Technology' 카테고리의 다른 글

MSA란 무엇인가?  (0) 2023.02.15
파티션 테이블 목록  (0) 2022.11.22
AIX 서버 Login 안될 때 확인 방법  (2) 2022.10.04
WebLogic(웹로직) 이란?  (0) 2022.07.19
애자일이란 무엇인가?  (0) 2022.07.15