[EMC Storage] Business Continuity Overview

Posted by seunggwon
2008. 8. 27. 21:00 IT Note/Server

Business Continuity Overview(무중단 업무 운영 개요)
본 모듈의 학습을 통해 아래 내용을 이해할 수 있다.
무중단 업무 운영(Business Contiuity)과 재해 복구(Disaster Recovery)의 정의와 차이점
재해 복구(Disaster Recovery)와 재해 재가동(Disaster Restart)의 차이점
Recovery Point Objective(RPO)와 Recovery Time Objective(RPO)의 개념 정의
무중단 업무 운영 구축 계획 시의 고려사항
장애 원인을 찾아내고 그 원인을 제거할 수 있는 해결책 제시


Business Continuity(무중단 업무 운영)란?
무중단 업무 운영(다른 말로 비즈니스 영속성이라고도 한다.)이란 비즈니스 업무 운영에 악영향을 미칠 수 있는 애플리케이션 중단에 대한 대비(서비스 요청에 대한 응답, 데이터 복구 등)를 의미한다.
무중단 업무 운영 솔루션은 시스템의 업무 중단, 애플리케이션 성능 저하 혹은 복구 불가능한 시스템 현황들의 문제를 해결한다.


Disaster Recovery versus Disaster Restart
대부분의 중요한 비즈니스 애플리케이션들은 일정 수준의 데이터 상호 의존성을 가진다.
Disaster recovery(재해 복구)
기존 데이터 복사본을 restore하고 데이터의 일관성 유지를 위해 복사본의 logs를 적용한다.
일반적으로 백업기술을 말한다.
데이터를 Tape에 복사하고 소산하여 보관한다.
데이터 복구 시 매뉴얼 작업의 개입이 요구된다.
Disaster restart(재해 재가동)
Mirror된 동일한 데이터와 애플리케이션을 재가동하는 과정
일관성 있는 데이터 유지와 애플리케이션 사용을 위해 DBMS의 재가동이 요구된다.
재가동 시간은 전원 장애 후에 애플리케이션의 재가동을 위해 요구되는 시간과 비슷하다.


Business Continuity vs. Disaster Recovery(무중단 업무 운영 vs. 재해 복구)
무중단 업무 운영은 장애에 대한 사전 예방을 위해 초점을 맞춘다.
위험 요소에 대한 예측
비즈니스 기능을 유지하기 위한 절차
재해 복구는 장애 발생시 정상적인 업무 운영이 가능한 원래 상태로의 복구를 위한 활동에 초점을 맞춘다.


Business Contiuity Planning(BCP)
아래와 같은 활동들을 의미한다.
미션(Mission) 혹은 중요한 비즈니스 기능들을 인지
현재의 비즈니스 프로세스에 관한 데이터를 수집
평가, 우선 순위 정의, 위험요소의 완화와 관리
위험요소 분석(Risk Analysis)
비즈니스 영향 분석(Business Impact Analysis : BIA)
불시에 일어날 수 있는 모든 상황과 재해에 대비할 수 있는 복구 계획의 디자인과 개발
교육, 테스트 그리고 유지보수


HBA Failures
Multi-HBA 구성과 multi-pathing 소프트웨어 사용
HBA 장애에 대비
향상된 성능을 제공(vendor dependent)


Switch / Storage Array Port Failures
Multiple switch 환경 구성
Multiple storage array port 구성을 통해 디바이스에 대한 가용성을 확보


Disk Failures
RAID 기술을 사용


Host Failures
호스트 장애에 대비하여 클러스터링 기술을 적용


Site/Storage Array Failures
원격 복제 기술을 사용하여 지역 인프라 전체 혹은 storage array 장애에 대비할 수 있다.


Business Contiuity Technology Solutions
Local Replication (로컬 복제)
Remote Replication (원격 복제)
Backup / Restore (백업 / 복구)


Local Replication (로컬 복제)
운영중인 디바이스의 데이터는 같은 스토리지 내의 타겟(target 또는 replica) 디바이스에 복제된다.
필요한 작업이 완료되면 복제된 디바이스는 운영 디바이스의 데이터와 동일한 내용을 가지게 된다.
결과적으로 데이터의 복사는 중단될 수 있고, 이 시점에서 복제된 디바이스는 운영 디바이스와는 별도로 독립적으로 이용될 수 있다.
복제는 데이터 손실이나 그 밖의 장애가 발생 했을 때 정상적인 업무운영으로의 복구를 위해 사용된다.
아울러 복제된 디바이스에 있는 데이터는 테이프에 복사할 수 있다. 이것은 운영중인 디바이스의 백업으로 인한 성능 저하의 부담을 덜어준다.


Remote Replication (원격 복제)
운영 디바이스에 있는 데이터는 원격에 있는 다른 array의 target(replica) 디바이스로 복제된다.
Target 디바이스는 운영 디바이스와 지속적인 데이터 동기화를 유지한다.
운영 디바이스의 업무 중단을 대비해서 애플리케이션은 target 디바이스에서 운영될 수 있다.


Backup / Restore (백업 / 복구)
테이프 백업은 데이터 가용성과 무중단 업무 운영을 보장하기 위해 사용되는 보편화된 방법이다.
비용이 저렴하고 높은 성능의 디스크 드라이브는 디스크 백업을 위해 사용된다. 이것은 백업과 복구 작업에 소요되는 시간을 많이 줄여준다.
백업의 빈도는 데이터의 변화 비율 등을 포함한 여러 가지 요구사항을 고려한 PRO / RTO에 의해 결정된다.


EMC PowerPath에 대한 이해
스토리지 환경에서 PowerPath를 사용할 때의 특징과 이점에 대해 설명
PowerPath가 어떠한 방식으로 업무에 영향을 주지 않고 장애 복구를 수행하는지 설명


What is EMC PowerPath
호스트 기반 소프트웨어
애플리케이션과 SCSI 디바이스 드라이버 사이에 위치
지능적인 I/O Path 관리 기능을 제공
애플리케이션에 영향을 주지 않는다.(Transparent)
호스트로부터 array까지의 장애를 자동 감지하고 복구


PowerPath Features
다양한 I/O경로, 고가용성과 고성능을 보장
동적인 Multi-path로의 부하 분산
사전 Path 감지와 자동 path 복구 기능
자동 path 장애 복구 기능
온라인 path 구성과 관리
고용성 클러스터를 지원


PowerPath Configuration
모든 볼륨은 가용한 모든 Path를 통해 접근이 가능
최대 32개의 Path를 지원
지원 가능한 토폴로지 : SAN, SCSI, iSCSI


The PowerPath Filter Driver
플랫폼에 독립적인 드라이버
애플리케이션은 PowerPath에 직접 I/O를 발생시킨다.
PowerPath는 현재의 workload와 path 가용성을 바탕으로 최적의 경로로 I/O를 발생시킨다.
특정 path에 장애가 발생하면 PowerPath는 다른 경로를 선택하여 I/O를 발생시킨다.


Path Fault without PowerPath
대부분의 환경에서 호스트는 소토리지 시스템에 접근하기 위한 여러 경로를 가진다.
볼륨은 가능한 모든 경로로 접근할 수 있게 구성되어 있다.
각 볼륨은 하나의 경로를 갖는다.
호스트 어댑터와 케이블의 연결은 하나의 장애 포인트가 될 수 있다.
Workload는 모든 경로로 분산되지 않는다.


Path Fault with PowerPath
만약 호스트 어댑터, 케이블 또는 채널 디렉터 / 스토리지 프로세서에 장애가 발생하면 디바이스 드라이버는 PowerPath로 타임아웃을 발생시킨다.
PowerPath는 장애 경로를 오프라인 시키고 다른 경로를 통해 I/O를 발생시킨다.
이후에 발생되는 I/O는 가용한 경로를 사용한다.
애플리케이션은 장애를 감지하지 못하고 정상 운영된다.

'IT Note > Server' 카테고리의 다른 글

[EMC Stroage]EMCPA 시험 후기  (0) 2008.09.20
[EMC Storage] SAN  (0) 2008.08.21
[EMC Storage] NAS(2)  (0) 2008.08.20