[EMC Storage] Meeting Today's Data Storage Needs

Posted by seunggwon
2008. 8. 4. 21:00 IT Note/Server

- 1강은 오늘날 데이터 스토리지의 필요성에 대해서...
 오늘날 데이터를 생성하는 주체와 얼마나 많은 데이터가 생성되고 있는지를 학습하고, 비즈니스 성장을 위한 데이터의 가치, 데이터 저장 모델의 발전 단계, 대용량의 데이터 저장을 위한 대표적인 저장장치의 종류에 대해 학습을 하겠습니다.

데이터 생성
데이터는 계속해서 높은 증가율을 보이면서 생성되어지고 있다. 데이터의 생성 및 발생 빈도는 매년 50%이상의 비율로 증가하고 있다. 접근 용이성이 보장되는 데이터를 장기간 저장해야 하는 필요성 또한 점차 빠른 추세로 증가하고 있다.
Information Technology(IT) 예산에도 이러한 추세가 반영되고 있다. IT 예산은 전통적으로 서버, 네트워크, 스토리지, 직원들의 임금 등의 지출에 할당되어 왔다. 데이터 스토리지의 중요성이 점점 높아짐에 따라서 스토리지에 대한 비용 지출도 비례하여 증가하고 있다. IT관련 비용의 약 40%가 데이터 스토리지와 관련된 부분에 쓰여지고 있다고 예측된다.

데이터 생성 : 개인
각 개인에 의해 생성되는 데이터
예를 들면 : 사진 파일, 문서, 스프레트시트, 동영상
어디에 데이터가 저장되는가?
데이터가 저장될 수 있는 매체 : 디지털 카메라, MP3 플레이어, 노트북 및 PC 하드디스크 드라이브, CDROM 및 DVDs, USB drives

데이터 생성 : 비지니스
비즈니스의 필요성에 의해 생성되는 데이터
예를 들면
제품관련 데이터 : 재고목록, 제품설명, 가격, 수익성, 판매수익 및 예상매출
고객 데이터 : 주문 고객, 고객별 선호 제품, 배송 내역
금융 데이터 : 은행거래, 보험 및 금융 서비스 거래 내역
의료 데이터 : 의료 서비스 분야, 보험, 병원 진료 내역
어디에 데이터가 저장되는가?
비지니스 데이터가 저장될 수 있는 매체 : 직원 워크스테이션, 서버, 디스크 어레이, 테이프, CDROM 및 DVD, 문서 보관소

비즈니스를 위한 데이터의 가치 : 정보
수집된 데이터를 이용한 비즈니스
수집된 데이터는 비즈니스에 필요한 "정보"로 활용되어야 한다.
정보의 예 : 고객의 구매 습관과 패턴, 환자의 건강기록, 고객의 신용카드가 자주 사용되는 위치

비즈니스에서의 정보의 가치
새로운 비즈니스 기회를 제공
- 구매 / 소비 패턴 : 인터넷 쇼핑, 소매점, 슈퍼마켓
- 고객 만족 / 서비스 : 배송 추적, 배송 확인
기존 비즈니스들의 변화를 이끌어 내는 새로운 기회를 찾아낸다.
- 비용절감 : 정확한 재고 목록 분석 및 적절한 재고 소진, 배송 단계의 최적화로 운임 비용 절감
- 새로운 서비스 : 도난 카드 사용시 보안 경보 및 추적
- 고객 분석 마케팅 : 고액 계좌를 보유하고 있는 은행 고객을 선정하여 차별화된 재테크 상품을 권장
경쟁력 있는 새로운 이익을 창출

개인 데이터의 비즈니스적 가치
어떤 데이터가 개인에 의해 생성되어지고 어떻게 비즈니스에서 가치를 가질 수 있을까?
예를 들면 : 온라인 구직 사이트, 온라인 사진저장 및 공유 서비스

정보의 가용성 - 업무 중단은 막대한 비용손실을 야기한다.

데이터의 구분
데이터는 구조화된 데이터와 구조화되지 않은 데이터로 구분될 수 있다.
기업정보의 80%이상이 구조화되지 않았다.
이러한 데이터는 모두 전통적인 방식으로 저장되어 진다.

데이터 스토리지 모델 : 발전과정
중앙 집중화 : 단말기로 통신하는 메인프레임 컴퓨터에 연결된 내부/외부 저장장치(디스크, 테이프)
탈집중화(분산) : Open Systems의 시대가 도래함으로서 기업들이 Client-Server 환경을 비즈니스 모델로 채택
중앙 집중화 : 네트워크 스토리지(Networked Storage) : 현재 IT환경에서 가장 많이 사용되는 Best Practice 모델

일반적인 데이터 저장 매체와 솔루션
테이프 라이브러리 : 여러 개의 테이프 드라이버와 테이프로 이루어진 저장장치
주크박스 : 여러 개의 광디스크와 드라이버로 이루어진 저장장치
디스크 어레이 : 여러 개의 하드 디스크로 이루어진 저장장치
각각의 솔루션은 데이터 저장과 관리를 위한 특정 요구를 처리한다.
- 테이프 라이브러리 : 데이터의 백업/복구

==========================================================================
 그리고 용어관련 숙제...
- 기밀성(Confidentiality) : 정보를 오직 인가된 사람들에게만 공개하는 것이다. 즉, 전송되는 데이터의 내용을 완벽하게 보호(알아보지 못하게 하는 등)하여 해킹 등이 발생하더라도 비인가자가 정보의 내용에 접근하는 것을 방지하는 보안서비스를 말한다.
- 가용성(Availability) : 데이터, 정보 및 정보시스템이 요구된 방법으로 적시에 접근이 가능하고 인가된 사용자는 필요할때 항상 정보의 사용이 가능한 특성을 말한다.
- 무결성(Integrity) : 애초의 의사표시 내용이 상대방에게 동일한 내용으로 전달되었는가를 말하는 것이다. 즉, 메시지가 제3자 등에 의해 중도에 임의로 변경되지 않았는가를 확실하게 보장하는 보안서비스 용어이다.

 또 하드웨어 용어를 알아오라는 숙제도 있다. 좀 많던데...그냥 간단한거 몇가지만...
- 실린더(cylinder) : 하드디스크를 구성하고 있는 모든 원판 상에 위치하고 있는 단일 트랙 위치(같은 트랙번호를 갖는 각 면에 있는 트랙들의 집합)를 말한다. 예를 들어, 만약 하드디스크가 4장의 원판으로 구성되어 있고, 각각은 600개의 트랙을 가지고 있다면, 거기에는 600개의 실린더가 있고, 각 실린더는 8개의 트랙으로 구성될 것이다 (각 원판은 양면 모두에 트랙이 있다고 가정한다).
- 헤드암 : 헤드와 연결된 헤드암은 헤드가 플래터 위를 자유롭게 움직이며 데이터를 읽을 수 있게 하는 기기입니다. 헤드암은 콘트롤러 칩이라고 불리는 제어회로에 따라 PC에서 원하는 정보를 읽고 쓸 수 있도록 헤드를 움직입니다.
- 호스트(host) : 메인프레임 컴퓨터 환경에서, 호스트란 하나의 메인프레임 컴퓨터를 말한다 (요즘은 이런 컴퓨터를 '대형 서버'라고 부른다).이 상황에서 메인프레임은 단말기가 부착되어 있으며, 메인프레임은 이 단말기에게 서비스를 제공하는 호스트가 된다 (여기서 호스트는 항상 서버가 되고 워크스테이션은 항상 클라이언트가 된다는 것을 의미하는 것은 아니다. 클라이언트/서버 관계는 호스트라는 용어의 사용과 관계없는 하나의 프로그래밍 모델이다).
- L1 캐시메모리 : "level-1"의 약자로서, 마이크로프로세서 칩 그 자체 내에 마련되어 있는 캐시 메모리이다. 예를 들어, 인텔 MMX 마이크로프로세서의 경우에 32 KB의 L1 캐시메모리가 딸려 나온다.
- L2 캐시메모리 : "level-2"의 약자로서, 메인 메모리에 비해 더욱 빠르게 액세스할 수 있도록, 별도의 칩이나 확장 카드 상에 구현되어 있다. L2 캐시메모리는 현재 256 KB 정도의 크기가 가장 보편적이다.
 나머지 용어는 http://www.terms.co.kr/에 잘 나와있기땜에... 숙제는 이정도로 마무리...

 이걸로 1일차는 마무리!!!