February 12, 2009

사장님!! 우리도 SSD 쓰게 해 주세요?!!

최근에 Solid State Disk가 붐인 것 같습니다. 작년 말부터 많은 IT잡지 및 신문에서 SSD 및 관련 기술에 대한 기사가 상당히 많이 다루어 지고 있고, 최근에 스토리지 벤더들은 앞을 다투어 너나 할 것 없이 SSD를 지원하는 스토리지 제품을 발표한다고 아주 바쁜 것 같습니다. 업계의 많은 전문가들이 SSD가 스토리지 시장에 많은 변화를 가져 올 것이라고 예측하고 있고, 스토리지 시스템을 사용하는 고객들에게도 많은 장점을 제공한다는 점은 의심의 여지가 없어 보입니다. 

SSD의 장점

사실 SSD를 장착한 스토리지 제품이 주는 장점은 많이 있습니다. 고속으로 회전하는 Magnetic Platter Head를 이동시키는 방식으로 데이터를 읽거나 저장하는 기존의 HDD방식 대비, 20배 빠른 데이터 처리 속도 제공, HDD에 비해 적은 전원 소모 (Watt 1,000 Operation처리 Vs Watt 5 Operation 처리), 그리고 HDD에 비해서 가격이 10배 정도 비싸기는 하지만, HDD에 비해 약 100배 정도 빠른 처리 성능을 제공하므로, 우수한 가격 대비 성능을 제공하는 수단이라고 할 수 있습니다. 이렇게 많은 장점에도 불구하고 아직 많은 고객들이 사용하기에 부담스러운 이유는 가격이 많이 비싸다는 것입니다. 따라서 좀 더 기술이 진보하여 가격이 어느 수준까지 내려 오기 전까지는 고성능 처리가 필요한 일부 어플리케이션 용으로 사용될 것으로 예상이 됩니다.

   

SSD의 단점

모든 분들이 다 알고 있듯이 가격이 비싸다는 점 이외에는 문제점이 없을까요? 가격 외에도 SSD가 좀 더 대중화 되려면 다음의 몇 가지 기술적 문제점들을 해결하여야 합니다.

Reliability

첫 번째는 안정성입니다. SSD NAND기반의 Flash 메모리를 사용하게 되는데, Flash메모리의 단점은 데이터를 기록할 수 있는 횟수가 정해져 있다는 것입니다. 즉 데이터를 기록하면 할수록 매체가 닳아서(?) 더 이상 데이터를 기록할 수 없는 특성이 있습니다. (일반적 SSD에서 제공되는 기록가능 횟수는 100,000번 정도라고 이야기 하고 있기는 하기만, 실제로는 이 보다는 더 오래 사용한다고는 합니다.) 그렇다고 하더라도, 기록이 가능한 횟수에 제약이 있다는 사실에는 변함이 없습니다.

Write Performance

두 번째는 Write의 성능이 Read에 비해 현저하게 느리다는 것입니다. 위에서 이야기 한 일정 횟수 이상 기록을 할 수 없다는 점과 Write시 성능이 현저하게 저하된다는 점은 Flash Cell이 데이터를 저장하는 방식에 기인하게 됩니다. 일반적인 HDD에 데이터를 기록하는 방식과는 달리 SSD에 데이터를 저장하기 위해서는 해당 블록을 완전히 지우고, 데이터를 새로 기록해야 하기 때문입니다. 특히 Small Random Write 유형의 I/O에 취약하고, I/O의 단위가 작으면 작을수록 성능이 더 많이 저하 된다고 하니, OLTP성 업무에 SSD를 적용하게 되면, 생각 보다 성능이 많이 나오지 않는다고 느끼실 수 있습니다.

기존 Storage System Architecture 개선

세 번째로 SSD가 스토리지 시스템에서 효과적으로 활용되기 위해서는 사용하기 기존 스토리지 시스템에도 많은 개선이 필요하다는 것입니다. 지금의 대부분의 스토리지 시스템들은 HDD 성능을 기준으로 설계되었기 때문에, SSD의 높은 처리 능력을 소화 하기에는 부족한 면이 많이 있습니다. 마치 소형차에 최대 출력 460마력의 고급 스포츠카 엔진을 장착한 것과 같이 말이죠.

개인적인 판단으로는, 최근에 벤더들이 발표하는 SSD기반의 제품을 살펴보게 되면, SSD를 단순히 기존 제품에 추가하는 수준에 머물러 있어, 진보된 기술을 기반으로 하는 신제품을 소비자들에게 제공한다 기 보다는 SSD기술에 앞서 있다는 인식에서 우위를 선점하기 위한 마케팅 활동의 일부로 보여집니다. 

도입 시 고려 사항

높은 가격과 위에 나열한 개선되어야 할 기술적 문제점(?)들에도 불구하고, 반드시 SSD를 사용하셔야 하는 고객들도 분명히 있으리라 생각됩니다. 이런 고객들은 SSD기반의 스토리지를 도입할 때, 반드시 다음의 사항을 확인하시기 바랍니다.

·         SSD 스토리지 시스템 사용으로 모든 문제를 해결하기에는, 아직까지 SSD가격이 많이 비싸므로, 반드시 SSD 이외의 방법으로 문제 해결이 가능한지 확인 할 것. 보다 많은 Spindle을 사용하거나, 일부 벤더에서는 고 용량의 Read 전용 Cache를 장착한 제품을 공급하므로, 이러한 대체 기술들을 모두 확인 할 것.

·          위에서도 언급했듯이 SSD에 기록할 수 있는 횟수가 정해져 있으므로, 이 한계를 확인 하고, 이러한 SSD의 안정성을 개선하기 위한 기술을 채용하고 있는지 확인

·         성능 평가 시, Read성능, Write 성능, Read Write를 혼합해서 사용하는 3가지 경우를 구분해서 평가. 특히 도입하는 업무가 OLTP성 이면, 반드시 Small Random Write I/O환경에서 성능을 확인할 것. 추가적으로 SSD Write성능이Read성능에 비해 느린 것을 보완하기 위한 기술이 있는지 확인하고, 평가 항목에 추가

·         Midrange스토리지의 경우는 High-End스토리지에 비해 Architecture에 확장 성이 부족하므로, Midrange스토리지에서 SSD를 사용하는 경우, 문서상의 성능 수치를 그대로 믿기보다는 반드시 업무와 유사한 환경에서 Test를 통해 성능 검증이 필요.

November 10, 2008

VTL(가상 테이프 라이브러리 Virtual Tape Library) 의 진화

기하급수적으로 증가하는 대용량 데이터를 고 가용성, 고속으로 처리하기 위해서 서버와 디스크는 혁신적인 진화를 거듭해 왔습니다. 백업 미디어의 대명사인 물리적 테이프 라이브러리(PTL) 역시 DAT , DLT, LTO-1/2/3/4 등을 거치며 더 빠르고 더 많은 데이터를 백업 할 수 있도록 변화해 오고 있습니다. 하지만, 과거 20여 년 간 PTL 이 누렸던 주요 백업 수단으로서의 독점적 지위를 불과 2~3년여 만에 VTL에 넘겨 주고 말았다는 것입니다.

이미 2000년 초반에 소개된 VTL 은 PTL에 비해 RAID 기반의 빠른 성능과 안정성을 제공함에도 불구하고 비싼 디스크 가격으로 인하여 제한적으로 사용되며 소외되었지만, 디스크 가격의 급격한 하락과 더불어 2006년 국내에 본격적으로 소개된 후 올해 만개하고 있습니다. 그렇다고 VTL 이 PTL 을 완전히 대체하는 것은 아니며, 장기간의 규정준수를 위한 원격 소산을 위한 백업용도로서 PTL 의 용도는 지속될 것입니다.

초기 VTL 은 기존 PTL 환경의 백업 프로세스에 큰 변화 없이 원활하게 바로 적용될 수 있는 호환성이 무엇보다 중요하였습니다. 이후 VTL 과 PTL을 직접 연결하여 백업 서버의 부하를 최소화 하려는 요구로부터, 데이터 센터 내의 대용량 백업 데이터를 주어진 백업 윈도우 내에 처리하기 위한 고성능 대용량 시스템 스팩 경쟁이 주를 이루었습니다. 다음 단계는 고성능으로 평균 1:2 ~ 1:4 의 H/W 압축을 통하여 더 적은 디스크로 더 많은 데이터를 백업 받게 되었습니다.

최근 VTL 시장의 큰 화두는 백업 데이터 중복제거(Deduplication ) 인데요.. 일반적인 백업 데이터는 주기적인 풀 백업과 파일 기반의 증분 백업 패턴을 가지며, 저장된 백업 데이터 사이에는 80~90%에 이르는 높은 중복률을 보입니다. 이렇게 중복된 데이터 블록을 제거하여 적은 디스크 용량으로 많은 데이터를 백업 받아 디스크 저장 비용을 절감할 수 있는 것입니다.

중복제거는 운용 모드와 구현 방식에 따라 각기 안정성과 성능, 비용에 차이가 있으며, 그 방식에 따라 VTL 업계에는 몇 가지 재미있는 변화가 생기고 있는데요.

팔콘 스토어는 EMC, IBM, SUN 등에 VTL 엔진을 OEM으로 제공하면서 높은 VTL 시장 점유율을 기록해 왔습니다. 팔콘 스토어는 SIR(Single Instance Repository)라는 VTL과 별도의 H/W 기반의 어플라이언스를 통한 Post-중복제거 솔루션을 제공합니다. 기존 VTL 과 SIR 를 연결한 후, VLT에는 백업 데이터의 메타데이터만을 남기고 중복 제거된 블록만을 SIR에 저장합니다. 중복제거 시 고성능을 제공하고 안정성 향상 시키기 위해서는 SIR를 병렬 클러스터화 시켜야 합니다. 다소 복잡하고 불안정한 이러한 구현 방식은, 일체형 VTL이 아닌 서버 기반의 VTL 제품의 한계로서 어쩌면 당연해 보입니다.

EMC는 자사 스토리지에 리눅스 서버를 연결하고 JAVA 기반의 팔콘 VTL 엔진을 OEM한 분리형 VTL 패키지를 제공해 왔는데요. 최근에는 팔콘 스토어의 SIR 와 비슷한 방식인 퀀텀의 H/W 기반의 Post-중복제거 제품을 OEM 하고 있습니다.. EMC가 팔콘 스토어가 아닌 퀀텀 중복제거를 채택한 것은, EMC가 ADIC과 OEM 계약을 체결한 상태에서 퀀텀이 ADIC을 인수하였고 기존 계약이 종속되면서 가능하게 된 것입니다. 물과 불 같은 경쟁사 간에 불안한 동거가 시작된 것인데요. 여기에는 EMC와 팔콘 스토어간의 끊임없는 불화설이 한몫 했을 것으로 보입니다.

IBM 역시 EMC 와 같이 분리형 VTL 패키지를 제공하고 있었는데요. 최근에는 특유의 포식 본능을 발휘하여 딜리전트라는 VTL 엔진 및 중복제거 솔루션 기업을 인수하여 일체형 제품 출시를 앞두고 있습니다. 지금까지 IBM이 인수한 솔루션들 중에는 소화불량에 걸려 탈나는 경우가 많았는데요. 이번 VTL 의 경우는 성공할지 향후 귀추가 주목됩니다.

HP는 2가지 라인업을 제공하고 있습니다. 중대형 VTL은 Sepaton OEM VTL 제품에 별도 하드웨어 기반의 Post-중복제거 어플라이언스입니다. 소형 VTL은 HP 일체형의 In-Line 중복제거 제품입니다. 아직까지Sepaton의 Post-중복제거는 특정 백업 어플리케이션에만 호환이 된다고 합니다. 백업 어플리케이션들은 각기 다른 포맷으로 백업 데이터를 전송하므로 모든 환경에 중복제거를 수행할 수 있는 기술이 쉽지만은 않아 보입니다.

DataDomain은 자사 일체형 VTL에 In-Line 중복제거를 채택하고 있습니다. 백업 진행 과정에서 실시간 중복제거를 수행하는 In-Line 방식은, 일반적인 백업에 비하여 성능 저하가 심한데요. 최근에는 400MB/s 급의 VTL을 출시하고 있습니다. 하지만, 이 정도 성능으로 기업용 데이터 센터의 백업 윈도우를 맞추기에는 부족한 수치입니다. 어쩌면 DataDomain의 주요 비즈니스 시장인 Low-end 백업 시장을 타깃으로 하다 보니 다소 성능이 떨어지는 In-Line 중복제거에 포커스를 맞춘 것으로 보입니다.

Quantum은 ADIC 을 인수한 후 Tape 벤더라는 이미지에서 D2D, 중복제거와 백업 소프트웨어 벤더로의 발전을 꾀하고 있습니다. 자사의 일체형 VTL을 제공하고 있으며 2가지 라인업이 있습니다.. 중소형 VTL은 In-Line 방식을, 대형은 VTL 내부에서 자체적으로 중복제거를 수행합니다. 전반적으로 앞선 이상적인 기능들을 제공한다고 보입니다. 하지만 전체적으로 성능에 한계가 있어 데이터 센터용으로는 부족해 보이며, PTL과의 연동 시에는 아직 문제점이 보고 되고 있습니다. 급하게 출시된 중복제거 솔루션은 안정성 검증을 위한 기간이 필요해 보입니다. 최근에는 자사 주식의 급격한 하락으로 다우에서 퇴출(?) 위기에 직면하여 회사의 사활을 걱정해야 할 만큼 어려운 시기를 겪고 있습니다.

이와 같이 다양한 방식이 제공되고 있는 중복제거 기능은 VTL 뿐만 아니라 백업 분야 전체에서 비용 절감을 위한 선택이 아닌 필수 요소로 자리 잡고 있는데요. 이보다 먼저 고려해야 할 사항은 주어진 백업 윈도우를 맞출 수 있는 성능일 것입니다. 중복제거는 디스크 공간절약을 통한 높은 스토리지 효율성을 제공하지만 필연적으로 성능 저하를 수반합니다. 그러므로 In-Line 에 비하여 Post 중복제거가 대세일 것입니다. 하지만 대부분의 중복제거 솔루션은 중복제거용 소프트웨어와 하드웨어를 별도로 도입해야 하며, 용량에 따라 추가적인 라이선스를 구매 하여야 합니다. 혹시나 배보다 배꼽이 커지고 본말이 전도되는 것은 아닐지?. 더욱이 중복제거를 위해 백업 데이터를 VTL에서 또 다른 중복제거 장치로 옮기는 안정성 문제와 프로세스의 복잡성이 우려 됩니다.현 시점의 대안으로 VTL 하드웨어 압축을 통한 고성능과 추가적인 용량절감을 고려해 봄직 합니다.

넷앱은 자사 스토리지 컨트롤러에 자체 VTL 엔진과 중복제거 기능을 장착한 일체형 어플라이언스를 제공하고 있습니다. 대용량 모델인 VTL1400의 경우 8.2TB/h를 제공하며, PCI-E 기반의 고성능 하드웨어 압축을 통하여 백업 성능 저하를 최소화 합니다. 넷앱 VTL6 버전에서 지원되는 중복제거 기능은 별도의 라이선스나 하드웨어가 필요 없이 VTL 내에서 기본적으로 제공하는 기능으로 In-Line 과 Post 방식 모두를 즉각적으로 변경하면서 사용하실 수 있습니다. 넷앱은 이미 2년여 전부터 1차 2차 스토리지 모두에 중복제거를 기본으로 제공해온 유일한 스토리지 회사로서, 전세계 2500여 사이트에서 5000여대 이상에 적용되어 이미 성능과 안정성을 검증하였습니다. 최근에는 이기종 SAN 스토리지를 넷앱 스토리지로 가상화 하여 통합 관리할 수 있는 V-series 에도 중복제거 기능이 적용되어, 서로 다른 이기종 스토리지에 저장된 중복된 데이터들을 제거할 수 도 있습니다. 이러한 스토리지 기반의 중복제거 기술 노하우를 바탕으로 최근에는 VTL에도 고성능의 안정적인 중복제거 기능을 무상으로 제공하게 된 것입니다.

 

넷앱 스토리지와 VTL을 사용하시면 운영환경과 백업 프로세스 전체에 걸쳐 최상의 디스크 비용 절감 효과를 경험할 수 있습니다.

November 04, 2008

누구의 잘못인가? 이제는 말할수 있다.

시시비비[是是非非]

[명사]
1 여러 가지의 잘잘못. image
2 옳고 그름을 따지며 다툼.
일상생활속에서 다양한 형태의 시시비비를 볼수가 있으며 때로는 우리가 그 시시비비를 가르는 사건의 중심에 서 있기도 하고, 시시비비를 가르는 근거가 명확하지 않을경우 심각한 분쟁 상태로 발전할수도 있습니다.
특히 일상의 시시비비가 분쟁으로 발전할 경우 더욱이 법적 분쟁으로 발전할 경우에는 상당한 량의 서류준비의 어려움 과 스트레스, 시간소비를 병행하게 됩니다.
물론 개인간의 시시비비는 개인간의 합의를 통해 손쉽게 해결하는 방법도 있지만 만약 개인과 개인이 아닌 기업과 개인 즉 B2C(Business to Customer) 환경에서는 최근 어떠한 추세를 보이고 있을까요?
 

입증책임 주체의 변화

기존 B2C 분쟁시 시시비비의 증명에 있어 "책임있음"의 근거를 고객이 제시하여야 하는 경우가 많았으나, 최근에는 기업이 "책임없음"의 근거를 입증, 제시하는것이 점점 보편화되어 가고 있고 몇몇 인더스트리의 법률규정(ex: 전자금융거래법)은 기업의 근거입증의 의무를 명시하고 있습니다. 
실제적으로 많은 기업들이 텔레마케팅이나 콜센터 업무에 녹취 시스템을 도입하여 고객과의 통화내용을 녹음 보관하여 고객대응의 근거자료로 삼고 있으며, 몇몇 금융기관의 경우 새로운 상품이나 보험가입시 약관의 세부사항 (주로 고객에게 불리한 조건이나 특수 조건이 명시된 사항이 포함되어 있는)에 대한 충분한 설명을 들었으며, 내용을 이해하였다는 서류의 사인을 요구하고 있습니다. 
즉, 이제는 기업이 분쟁시 책임없음을 증명하는데 능동적으로 대응하여야 하며, 고객 개개인의 다양한 요청에 대하여 객관적으로 납득할수 있는 관련 프로세스 및 시스템 인프라를 구축하여야 하는 시장 환경이 도래하였다 말할수 있습니다.
 

분쟁대응/기록관리 시스템의 주요 기술적 요소

분쟁처리를 위해서는 분쟁처리 프로세스 및 해당 분쟁에 해당되는 기록(근거)관리 시스템이 필수적입니다.

이 시스템은 기록(근거)관리 솔루션을 기반으로 이루어 지며,  최적의 운영을 위하여 다츰과 같은 주요 기술적 요소로를 필요로 하고 있습니다. 

  • 저장된 기록(근거)의 진본성, 불변성, 무결성 확보
  • 장기간의 보관에 따른 시장 환경변화의 대응성 및 빠른 검색
  • 기록(근거) 저장소의 용이한 확장성
  • 데이터의 안정적인 보호
  • 비용 효율적 구조

이러한 요소들을 스토리지의 관점에서 재해석해하여 세부적으로 살펴보겠습니다.

저장된 기록(근거)의 진본성, 불변성, 무결성 확보

기존에는 CD-ROM이나 DVD ROM 형태의 저장 미디어가 지니는 WORM(Write once Read many)의 속성을 이용하여 한번 쓰여진 데이터의 진본성, 불변성 등을 보장하였으나,  느린 검색속도, 낮은 가용성, 복제의 어려움, 데이터의 안정성 (높은 고장률) 및 신뢰성 등의 단점을 가지고 있습니다

최근에는 이러한 단점이 극복한 외장형 스토리지를 이용하여 WORM 데이터를 저장하고 있습니다. 외장형 스토리지를 이용한 WORM 구성은 다음과 같은 장점을 가지고 있습니다.

  • 빠른 검색에 따른 대기 시간 감소
  • 데이터의 안정성(RAID 보호) 증가
  • 드라이브 고장에 따른 자동 교체
  • 데이터 손실 감소
  • 온라인 저장 데이터 확인 가능
  • 대용량 보관 가능 / 유연한 확장성 제공
  • 거리 제한이 없으며 WAN을 통한 원격지 복제가 가능 
  • 낮은 TCO
  • 관리의 편이성

image 넷앱은  1차급 스토리지인 넷앱 FAS 스토리지의 
SnapLock 기능을 이용하여 손쉬운 WORM을 구현
합니다.

넷앱 SnapLock의 특성
  - SEC 17a-4 규정 준수
  - 파일 레벨 retention 정책 지원
  - Retention 이후의 공간 재활용
  - 변경불가능한 ComplianceClock 을 이용한
     Retention Date의 완벽한 보장
  - Open protocol interfaces
  - CIFS 및 NFS를 통한 Data Access
  -  손쉬운 어플리케이션 연동
  - 고성능 1차 NAS 스토리지 플랫폼을 이용한
     최고의 성능 제공
  - 넷앱 FAS 전 제품에 적용

장기간의 보관에 따른 시장 환경변화의 대응성 및 빠른 검색

장기간의 데이터의 보관이 필요한 기록(근거) 관리 시스템이라는 전제조건 하에  정해진 시간내에 필요한 데이터를 추출하고, 장기간의 어플리케이션 변화에 따른 연동성 확보는 주요한 요소입니다.

하지만 현재의 일반적인 WORM 장비들이 2차 또는 3차 스토리지급의 전용장비의 형태를 갖추고 있고, 어플리케이션 연동을 위한 전용 API를 필수로 요청하고 있어,  "장기간" 이라는 전제는 외장 스토리지의 선택에 있어 많은 고민을 유발합니다.

넷앱의 FAS 상에서 구현되는 SnapLock의 WORM 기능은 고성능 1차 NAS 스토리지 플랫폼을 이용하여 동급 최고의 성능 제공하며, Open Standard Protocol인 NFS와 CIFS를 이용한 서버 Mount 방식의 WORM 볼륨 서비스를 제공하여 손쉬운 어플리케이션 연동을 제공하고 있습니다.

이러한 방식은 장기간의 보관 데이터의 빠르고 손쉬운 검색에 있어 기록(근거) 관리 시스템 어플리케이션과 훌륭한 시너지 효과를 제공하며, 변화에 대한 능동적인 대응을 가능케 합니다. 

 

기록(근거) 저장소의 용이한 확장성

image기록(근거) 데이터는 관련 필요업무 영역이 지속적으로 확대되면서 그 필요량이 기하급수 적으로 증가하고 있습니다. ESG 의 Report에 따르면 향후 5년내에 10배 이상 증가할것으로 예측되고 있습니다. 

이러한 증가는 저장공간의 지속적인 확충을 필요로 하는데 기록(근거) 데이터의 특성인 데이터의 진본성을 유지하는 측면과 대용량 데이터의 마이그레이션에 따른 장시간의 서비스 Dowm time이 필수적이라는 부분이 주요 고려 요소가 될수 있습니다.

SnapLock WORM 이 적용된 NetApp의 FAS 스토리지 시스템은 온라인 용량 확장, Zero Migration 모델 업그레이드를 제공합니다.

image

 

데이터의 안정적인 보호

기록(근거)데이터의 특성은 1차급의 Production 데이터라기 보다는 2차나 3차급인 Archive 나 Reference급의 데이터 특성을 가지고 있습니다. 이러한 특성은 SATA HDD를 이용한 스토리지의 구성을 동반합니다.

SATA HDD를 이용한 RAID 구성에 있어 그 안정성을 고려하여 WORM 볼륨의 Mirror 또는 Dual Parity를 적용하는 것이 일반적입니다.

image 

이중 넷앱 FAS 스토리지에서 제공하는 RAID Dual Pariyt는 단일 Parity 구성에 비하여 10억분의 1로 장애 확률을 줄일수 있는 기법이며, Mirror 보다 효율적인 공간활용율을 제공하면서도 단일 RAID Group내에서 Any 2 HDD의 장애에도 대비할수 있는 기법입니다.

 

비용 효율적 구조

기록(근거)관리를 위한 인프라의 일반적인 스토리지 구성은 어플리케이션 DB를 위한 FC HDD 탑재 SAN 스토리지, WORM 데이터 저장을 위한 SATA HDD 탑재 WORM 스토리지를 별도로 구성합니다.

하지만 넷앱의 FAS 스토리지는 독창적인 Unified 아키텍쳐를 통해 단일 스토리지내의  FC HDD와 SATA의 혼용구성, SAN 과 NAS, iSCSI의 동시구성, 일반볼륨과 WORM 볼륨의 동시구성을 지원하기 때문에 보다 simple하면서도 비용 효율적인 구성이 가능합니다.

image

                                                    <넷엡 FAS Unifed Archicture>

 

구축효과

조금은 길게 분쟁대응 시스템 인프라에 필요한 요소를 서술했는데, 과연 이러한 시스템을 구축함으로서 기업이 얻을수 있는 이익을 무었일까요? 그리고 고객된 사람입장에서 얻을수 있는것은 무었일가요? 손쉽게 생각되는 것들은 다음과 같은 내용들입니다.
  • 관련 규제의 대응
  • 대외 신뢰도 및 기업이미지 향상
  • 효율적인 분쟁 대응으로 RISK 감소
  • Business requirement 와 IT requirement의 효율적 만족

여기의 하나더 덛붙인다면 해당 기업에 대한 신뢰도 확보에 따른 및 고객으로서의 충성도 증가의 선순환의 시작이 있을수 있겠습니다.

 

글을 마치며

최근의 금융거래를 하는 모 기업으로부터 한통의 우편을 받았습니다. 내용은 "당신의 데이터를 이런방식으로 보안처리하여 보호하고 있고, 이는 어떠한 보안 규정을 만족합니다"라는 내용이었습니다. 우편 내용을 확인한후 개인적으로 해당 기업에 대한 믿음이 많이 상승된것은 말할것도 없겠지요, 당연히 해당 기업과의 지속적인 거래를 유지할 마음도 더 굳건해 졌습니다.

분쟁처리에 있어 이런형태의 정보를 기업으로 부터 받을수 있다면, 분쟁처리의 결과에 상관없이 해당 기업에 대한 고객 충성도를 높일수 있을것으로 생각됩니다.

October 23, 2008

이더넷 스토리지

데이터 센터 스토리지 네트워크의 대안 - iSCS & FCoE

  비즈니스 환경이 급변하면서 최적의 비즈니스 요구에 빠르게 부응할 수 있도록 비용 효율성, 유연성 및 확장성이 뛰어난 혁신적인 데이터 센터가 시장에서의 경쟁성 확보를 위한 요건으로 각광받고 있다. 그 중에서도 특히 스토리지 시스템은 데이터 센터에서 두 번째로 전력과 공간을 많이 차지하고 있으므로 보다 최적화된 구현 환경이 필수적이다. 

   현재의 데이터 센터는 해당 분야 및 적용 환경에 맞게 스토리지 네트워킹을 위한 여러 가지 대안 기술을 사용하고 있다. 주로 많이 사용되는 방식은 FC(파이버 채널) SAN 기반의 데이터 센터이며 그 뒤를 NAS, 급성장 중인 ISCSI SAN 및 INIFIBAND가 잇고 있다.

  일반적으로 이러한 기술의 선택은 기존 인프라스트럭처에 대한 투자 및 어플리케이션 요구 사항에 따라 결정된다. 그 방식들은 SAN, FC, ISCSI 등으로 나눌 수 있으며, 특징은 다음과 같다.

SAN(Storage Area Networks)

  SAN은 HBA(호스트 서버 어댑터) 또는 NIC(네트워크 인터페이스 카드) 및 스위치로 이루어진 전용 고속 네트워크를 통해 여러 서버를 공유 블록 스토리지 시스템과 연결한다. 이렇게 연결된 스토리지 네트워크에서는 서버와 스토리지의 연결 및 다중 경로 구성을 지원하여 중복성 강화, 성능 향상 및 스토리지 가용성을 보장한다. 또한 SAN은 스토리지의 가시성이 특정 서버 또는 어플리케이션으로 제한되도록 구성된다. 일반적인 SAN 어플리케이션에는 메시징 및 협업, 백업, 데이터 웨어하우징 및 데이터베이스가 포함된다.

FIBRE CHANNEL

  SAN에는 일반적으로 ANSI 표준 X3 230-1994(ISO 14165-1)에 규정된 물리적 구현과 신호 방식을 사용하는 FC(Fibre Channel) 프로토콜이 이용되고 있다. Fibre Channel은 광섬유, 동축 배선 또는 이중 나선 동축 배선을 이용해서 1Gb, 2Gb, 4Gb, 10Gb(ISL)의 속도로 SAN 데이터를 전송하며, 최근에는 8Gb 및 20Gb ISL까지 속도가 향상되었다. Fibre Channel은 지점간(point-to-point), 스위치 및 루프 모드로 작동하며, 이 중에서도 스위치 모드가 가장 많이 사용되고 있다.

  Fibre Channel은 SAN 구축 중 가장 많이 사용되며 특히 대형 데이터 센터에서 주로 채택되고 있지만 값이 비싸고 복잡하다는 것이 문제이다. 각 서버에는 전문 HBA가 필요하며, 각 HBA는 Fibre Channel 스위치 또는 디렉터 상에서 해당 포트에 연결하여 SAN 패브릭을 형성해야 한다. HBA 및 스위치 포트는 비용 상승 위험이 있으며 구성 측면에서도 수많은 조합이 가능하므로 상호 운용성 테스트와 관리를 위해 엄청난 시간과 노력이 필요하다.

ISCSI, FCIP, IFCP

  2003년 IETF(Internet Engineering Task Force)가 승인한 iSCSI 프로토콜을 기반으로 한 SAN이 처음 도입되기 전까지 대다수의 중소기업들은 값이 비싸고 복잡한 Fibre Channel 기반 SAN을 구축할 엄두조차 낼 수 없었다. 하지만 블록 기반의 IP 스토리지 기술인 iSCSI(Internet Small Computer System Interface) 외에도 IP 네트워크를 통해 Fibre Channel 데이터를 전송할 수 있는 FCIP 및 iFCP가 등장했다. FCIP(Fibre Channel over IP)는 인터넷을 통한 FC 네트워크 간 데이터 교환을 지원하며, iFCP(Internet Fibre Channel Protocol)는 FC 네트워크를 인터넷으로 확장할 수 있도록 지원한다. iSCSI는 네이티브 SCSI 명령을 IP를 이용해서 종단간에 전송할 수 있는 최초의 프로토콜이라고 할 수 있다. FCIP와 iFCP는 틈새 시장을 위한 기술이다.

iSCSI SAN은 이더넷 상에서 작동하기 때문에 비용(그림 1), 인력/관리 및 접근성 측면에서 다양한 이점을 제공한다. 이더넷은 고유한 "유비쿼터스" 특성 덕분에 규모에 관계없이 모든 조직이 신속하고 간편하게 IP 네트워크를 구축할 수 있는 이점을 제공한다. 또한 이더넷은 많은 사용자들에게 이미 친숙한 환경이기 때문에 IT(정보 기술) 직원이 별도의 FC 전문 교육을 받지 않아도 IP 환경을 쉽게 구축하고 관리할 수 있다. 또한 iSCSI SAN을 구현 및 관리하기 위해 전담 IT 직원을 추가로 고용할 필요가 없다. FC SAN은 일반적으로 데이터 센터에서 운영되지만 iSCSI는 IP 네트워크를 통해 LAN에서 WAN 및 인터넷까지 지원되므로 거의 모든 곳에서 스토리지를 이용할 수 있는 이점이 있다.

      그림 1) Fibre Channel 및 iSCSI 비용 비교. 출처: Forrester Research, 2008년 2월

  iSCSI SAN에는 일반적으로 격리된 네트워크로 구성된 NIC, iSCSI 소프트웨어 드라이버, 이더넷 스위치가 사용된다. 모든 주요 운영 체제에는 iSCSI 드라이버가 기본적으로 포함된다. TOE(TCP/IP offload engine)를 지원하는 이더넷 NIC를 구축하여 TCP/IP 처리에 필요한 CPU 요구량을 줄일 경우 iSCSI 성능을 향상시킬 수 있다. iSCSI는 표준 SCSI 명령 세트와 IP 네트워크를 활용하기 때문에 직접적인 상호 운영성의 이점을 얻을 수 있다. 현재 대다수의 iSCSI SAN은 1Gb 이더넷 속도로 작동하지만 10GbE(기가비트 이더넷) NIC, 스위치 및 스토리지 시스템이 현재 시장에 출시되어 있으며 지속적인 비용 감소로 인해 앞으로 10GbE 솔루션이 보다 일반화될 것으로 전망된다.

NAS(NETWORK ATTACHED STORAGE)

  iSCSI SAN과 NAS는 모두 동일한 IP/이더넷 네트워크를 이용하며 전문 교육이 필요하지 않고 Fibre Channel보다 훨씬 비용이 저렴하다는 점에서 유사하지만, 이 두 기술은 서로 다른 기술이다(그림 2 참조). iSCSI SAN은 블록 수준(디스크 드라이브)의 데이터 액세스를 제공하지만 NAS는 파일 수준(파일 서비스)의 데이터 액세스를 제공한다. 따라서 스토리지를 액세스하는 어플리케이션의 요구 사항에 따라 iSCSI 또는 NAS를 선택해야 한다.

  SAN 및 NAS의 공통점은 "네트워크"이다. 스토리지 네트워킹 이전의 기존 컴퓨팅 환경에서는 서버에 있는 내부 디스크를 이용해서 데이터를 저장했다. 클라이언트는 TCP/IP를 이용해서 이더넷 네트워크를 통해 컴퓨터에 연결했다. NFS(Network File System) 프로토콜은 로컬 컴퓨터 사용자가 TCP/IP 네트워크를 통해 원격 컴퓨터에 저장된 파일에 액세스할 수 있게 해준다. 사용자에게 원격 컴퓨터 상의 파일은 마치 로컬 하드 디스크에 있는 것처럼 보인다. 또한 NFS에서는 여러 명의 사용자가 네트워크를 통해 동일한 파일에 대한 액세스를 공유할 수 있다.

  Microsoft는 Windows® 컴퓨터에서 이와 동일한 유형의 파일 액세스를 제공할 수 있도록 SMB(Server Message Block) 프로토콜을 제작하여 NFS를 지원한다. SMB는 이후 더욱 향상되어 CIFS(Common Internet File System) 프로토콜로 명칭이 변경되었다. NAS의 큰 이점은 설치 및 사용이 간편하다는 것이다. 해당 스토리지를 TCP/IP 네트워크에 연결하여 CIFS(Windows) 또는 NFS(UNIX®) 프로토콜을 사용하여 TCP/IP를 통해 사용자가 스토리지에 액세스할 수 있도록 설정하기만 하면 된다. 일반적인 NAS 어플리케이션에는 파일 서비스, 파일 공유, 홈 디렉토리 및 그리드 컴퓨팅이 포함된다.

                               그림 2) Fibre Channel, iSCSI 및 NFS 기능 비교

INFINIBAND

  INFINIBAND는 고성능 컴퓨팅, 특히 성능 중심의 컴퓨터 클러스터 어플리케이션에서 주로 사용되는 스위칭 패브릭 커뮤니케이션 링크이다. INFINIBAND는 네트워크 스토리지 영역으로 확대되지 못했는데, 그 이유는 스토리지 공급업체 중에서 기본 INFINIBAND 스토리지 시스템을 판매하는 업체가 거의 없었기 때문이다.

이더넷 스토리지의 이점과 원동력

  세계적인 시장조사 기관인 IDC는 전세계 이더넷 기반의 스토리지 시스템(NAS 및 iSCSI SAN)이 2009년 $73억, 2010년 $92억, 2011년 $108억의 규모로 성장할 것으로 예측하고 있다. 한편, iSCSI SAN의 CAGR(복합 연간 성장률)은 61%, NAS는 13%이다. 이와는 대조적으로 FC SAN의 CAGR은 겨우 3% 대에 머무르고 있다. 그림 3에서와 같이 이더넷 스토리지는 성장을 지속하면서 2011년에는 Fibre Channel 스토리지 매출을 추월할 것으로 예상된다. 이더넷 스토리지의 성장은 주로 신규 데이터 센터 및 기존 데이터 센터의 확장 부문에서 이뤄질 것으로 예상된다.

그림 3) Fibre Channel 및 이더넷 스토리지 시스템 전망 예측. 출처: IDC Worldwide Disk Storage Systems Forecast, 2007년 5월.

  현재 이더넷 기반 스토리지의 지속적인 성장은 다음과 같은 이더넷의 이점에 크게 기인하고 있다.

  • 저렴한 비용의 상호 연결 기능: 제품 볼륨과 경쟁적인 시장 환경에서 이더넷은 가장 저렴한 스위치 및 어댑터를 지속적으로 제공하고 있다.
  • 유비쿼터스 연결: 현재 출시되고 있는 거의 모든 컴퓨터 시스템에는 이더넷이 내장되어 있으며 대부분의 데스크탑 컴퓨터에는 1GbE NIC가 포함되어 있다. 점점 더 많은 서버에서 마더보드에 LAN을 통합하고 고성능 서버 및 블레이드 기반 시스템으로 기본 10GbE를 지원하고 있다.
  • 검증된 상호 운영성: 처음부터 이더넷 네트워크는 어댑터, 허브, 스위치 및 라우터 등의 다양한 공급업체 제품 간의 상호 운용성을 보장한다. 여러 공급업체 간에 입증된 상호 운용성은 현재의 10GbE에서 향후 40GbE 및 100GbE에 이르는 연속적인 연결 속도 향상과 함께 앞으로도 계속해서 이더넷의 중요한 장점이 될 것이다. 이더넷 기반 제품에 대한 테스트 및 호환성 요구 사항은 Fibre Channel에 비해서도 매우 적다.
  • 관리 용이성: 이더넷 기반 스토리지는 추가 관리 툴 또는 Fibre Channel에 필요한 것과 동일한 수준의 교육이 필요하지 않으며 기존 이더넷 네트워크 관리 환경에 바로 통합될 수 있다.

  통합 멀티프로토콜 스토리지 시스템: 기업 고객들은 수년간 통합 스토리지 시스템을 사용하고 있다. 예를 들어 넷앱 고객들의 경우 5년 이상 이더넷 기반(iSCSI, NFS, CIFS) 솔루션과 동일한 플랫폼에 Fibre Channel SAN을 추가하고, 파일 기반 스토리지 및 블록 기반 스토리지의 데이터를 구축, 관리 및 복구할 수 있는 유연성을 통해 통합 아키텍처를 사용하여 변화하는 요구 사항에 대처하고 있다. 그 결과 IT 작업은 간소화되고 직원 및 자산의 생산성은 향상되었다.

이더넷 스토리지의 원동력

  현재는 물론 미래까지 이더넷 스토리지의 발전에 영향을 주는 시장 환경의 요소 중 하나는 가상화이다. 서버 통합 및 가상화는 효율성, 유연성 및 확장성이 뛰어난 기업 인프라스트럭처를 보장한다. 그러나 데이터 센터 혁신 전략에서는 시장 및 비즈니스 요구 사항에 대한 대응 능력을 극대화하고 서버 가상화를 통한 이점을 최대한 실현시키기 위해 서버뿐만 아니라 스토리지까지 고려되어야 한다. 이더넷 스토리지는 비용 구조, 사용의 용이성, 10GbE의 성능의 이점 때문에 가상화 환경에 매우 이상적이다. 최근 ESG 조사에 따르면 현재 서버 가상화를 이용하는 엔터프라이즈 고객은 가상화를 위해 갖춰진 물리적 서버의 수를 2배로 늘리고 이들 서버에서 실행되는 가상 서버의 수도 150% 이상 증축할 계획인 것으로 나타났다. 이러한 수적 증가는 10GbE 기반의 고성능 네트워크 및 스토리지를 통해 수많은 이점을 제공할 것이다. 10GbE는 1GbE 연결을 공유하는 다수의 가상 시스템보다 리스크가 훨씬 낮은 대안 통합 시스템이다.

ISCSI SAN 부팅, 서버 가상화 원동력 - ISCSI SAN은 SAN 부팅 가능 디바이스에서 가상 서버를 제공하는 기능과 결합될 경우 FC SAN보다 훨씬 뛰어난 기본적인 이점을 제공한다. 이러한 이점은 다음과 같이 세 가지로 구분할 수 있다.

  • 데이터 보호 향상: iSCSI SAN 토폴로지의 게스트 운영 체제(가상 시스템)에서 테이프 또는 디스크 백업을 직접 수행할 수 있다. 반면에, FC SAN은 물리적 스토리지에 대한 액세스를 중재하고 가상 시스템과 물리적 스토리지 간의 관계를 제어하는 가상 시스템 하이퍼바이저(ESX for VMware®)에 관리 레이어를 추가한다. 그 결과 일부 어플리케이션의 기능이 제한될 수 있다.
  • 가상 시스템 이동성 향상: 가상 시스템 및 이와 연결된 어플리케이션의 이동성은 서버 가상화의 주요 이점이며, iSCSI 간소화된 관리의 이점과 결합된 SAN 부팅은 이러한 이점을 더욱 부각시켜 준다.
  • 복잡성 감소: SAN의 복잡성 및 비용 문제를 해결하기 위한 iSCSI 및 SAN 부팅 기능은 특정 가상 서버 환경에 국한되지 않는다는 것이 장점이다. 그러나 복잡성 감소는 리소스 통합 및 관리 간소화에 따른 제안 가치와 연결되어 있다는 점에서 가상 서버 환경에서 중요한 의미를 갖는다.

  10GbE, iSCSI SAN 부팅 및 가상화 외에도 UNIX 환경(예: Sun™ Solaris™, HP HP-UX 및 IBM AIX)에 대한 iSCSI의 보급 확산으로 인해 특히 엔터프라이즈 데이터 센터에서 이더넷 스토리지의 증가를 촉진시키는 데 기여하고 있다. IDC의 분기별 디스크 스토리지 시스템 분석 보고서(Disk Storage Systems Quarterly Tracker)에 따르면 iSCSI UNIX 매출은 2007년 3분기에서 4분기까지 26% 증가한 것으로 나타났다.

NFS(NETWORK FILE SYSTEM)

  사용자 파일은 IT 조직에서 가장 빠르게 증가하고 있으며 리치 디지털 컨텐츠 파일, 데이터베이스, 가상 서버 환경, NFS 4.0 및 pNFS의 추세와 이용 사례는 네트워크로 연결된 파일 기반 이더넷 스토리지의 증가에 크게 기여하고 있다.

  • 풍부한 디지털 컨텐츠 파일 – 비디오 편집, 고급 모델링 및 석유 및 가스 탐색과 같이, 다양한 디지털 컨텐츠 파일을 생성하고 대형 파일 및 파일 시스템 크기 제한이 요구되는 성능 중심의 어플리케이션이 많이 있습니다. 그에 따라 파일 기반 스토리지의 일관성과 메타데이터의 높은 유연성을 위해 파일 기반의 스토리지 네트워크를 구축하는 고객이 점차 증가하고 있습니다.
  • 데이터베이스 – 오라클의 경우 Direct NFS 클라이언트를 개발하여 NFS의 내장된 다중 경로 기능을 사용해 데이터베이스 작업 로드를 훨씬 쉽게 수행할 수 있도록 지원하고, 필요한 드라이버 및 복잡한 상호 운용성 문제를 해결하고 있다. 이는 대부분 온디멘드 인프라스트럭처에서 NFS를 사용하고 있으며, 이는 데이터베이스 집약적인 환경에서 파일 기반의 프로토콜에 대한 적합성을 보여주는 사례이다.
  • 가상화 서버가 모든 어플리케이션 서버로 인식되고, 블록 프로토콜을 통해 스토리지에 연결될 수 있어도 데이터는 NFS를 통해 액세스할 수 있는 파일에 포함되어 있다. 가상화 선두업체인 VMware는 모범 사례 가이드라인에 NFS 사용의 모범 사례를 포함했고, VMware 서버를 백엔드 스토리지에 연결하는 방법으로 NFS 사용을 대폭적으로 지원하고 있다. VMware ESX Server 3.0에서는 Network File System 상에서 가상 디스크 저장(VMDK)을 위한 지원 기술이 도입되었다. 이 솔루션의 장점은 스토리지가 ESX 서버에 제공되면 VMware 관리자가 필요에 따라 스토리지를 자유롭게 사용할 수 있고 포트당 소요되는 비용도 Fibre Channel 솔루션보다 훨씬 저렴하며 성능 또한 뛰어나다는 점이다.
NFSv4

  Network File System v4는 현재 제공되고 있으며, 이전 버전에 비해 액세스 향상 및 대기 시간 감소, 간편한 방화벽 전송 및 서버당 지원되는 클라이언트 수 증가, 내장된 클라이언트-서버 보안 협상 및 액세스 컨트롤 목록을 통해 보안 강화 등과 같은 장점을 가지고 있다.

pNFS

  pNFS(Parallel NFS)는 NFS v4 의 확장 기술로서 클라이언트가 직렬 및 병렬 방식으로 스토리지 디바이스에 액세스할 수 있도록 지원한다. 이러한 이점은 데이터 및 메타데이터의 분리를 통해, 그리고 그림 4에서와 같이 데이터 경로 밖으로 메타데이터 서버를 이동시킴으로써 얻을 수 있다. PNFS는 병렬 I/O의 이점과 네트워크 파일 시스템의 이점을 동시에 제공하여 스토리지 인프라스트럭처에서 높은 확장성을 제공하므로 기존 투자 가치를 보호하게 된다.

                                      그림 4) pNFS 구성. 출처: pNFS.com.

I/O 통합

  많은 IT 조직들은 여러 개의 네트워크를 운영하고 있다. 예를들어 IP 네트워킹용 네트워크, 스토리지용 네트워크, 고성능 컴퓨팅 환경을 위한 IPC[Inter-Process Communication]용 네트워크 등이 그러하다. 이러한 네트워크를 유지하는 데에는 추가 자본 장비, 추가 배선 비용 및 복잡성, 관리 비용, 여러 구성 요소에 의해 소요되는 추가 전력 및 냉각 비용(그림 5 참조) 등 여러 가지 측면에서 많은 비용이 소요되기 마련이다.

                                 그림 5) 다중 네트워크 및 구성 요소

  I/O를 통합 및 단일화할 경우 HBA, 스위치 및/또는 스토리지 시스템이 동일한 물리적 이더넷 인프라스트럭처를 이용해서도 여러 가지 유형의 트래픽을 지원하고 매우 다양한 특성 및 요구 사항까지 처리할 수 있다. 네트워크 측면에서 볼 때 이는 세 개의 네트워크가 아닌 하나의 네트워크를 설치하여 운영하는 것과 같다. 그러나 호스트, 패브릭 및 스토리지 시스템 측면에서 본다면 고객은 호스트 버스 어댑터와 NIC, 케이블, 스위치 및 스토리지 시스템을 적게 구입해도 된다는 이점이 있다. 또한 이는 서버 상의 PCI 슬롯의 수의 감소를 의미하고, 이러한 이점은 특히 블레이드 서버에서 두드러지며 전력, 장비 및 관리 비용 감소에 기여한다.

  I/O 통합은 단일 네트워크에서 세 가지 모든 유형의 네트워크 트래픽 지원을 보장한다. 이러한 통합이 가능한 주요 요인은 동일한 링크에서 다중 트래픽 흐름을 지원하기 위해 충분한 대역폭과 대기 시간의 특성을 갖춘 기술인 10기가비트 이더넷이다. 10GbE의 도입 및 유비쿼터스에 기여하는 요인들은 매우 다양하다. 먼저, 다중 소켓, 다중 코어 서버 기술은 더욱 많은 네트워크 처리량을 요구하는 더 높은 작업 로드 수준을 지원하고 있다.

  또한 서버 가상화는 네트워크 처리량 요구의 원인이 되는 작업 로드를 통합시켜 준다. 많은 양의 I/O 트래픽을 생성하는 각 어플리케이션과 OS 인스턴스가 포함된 단일 물리적 서버 상에서 여러 어플리케이션과 OS 인스턴스를 집합시키는 가상화는 기존 1GbE 인프라스트럭처에 대한 수요 증가를 의미한다. 보다 높은 I/O 속도, 더 많은 용량 및 더 빠른 연속적 프로비저닝을 지원하는 1GbE 스토리지 시스템에 대한 수요는 특히 높다.

네트워크 스토리지 사용을 증대시키려면 서버와 스토리지 간의 대역폭을 더욱 늘려야 한다.

  10GbE 기술은 iSCSI 및 NAS에 중점을 둔 IP 기반의 네트워크 스토리지 전략을 기업 전반에 구축하는 데 있어서 문제가 되던 성능 요구 사항을 해결할 수 있다. 10GbE와 I/O 통합을 함께 구축할 경우 모든 규모의 데이터 센터를 위한 통합 연결 환경으로서 이더넷의 이점이 크게 부각된다. 통합 패브릭 및 네트워크 스토리지는 대형 규모의 경제, 광범위한 관리 전문성 및 익숙한 관리 툴 등 이더넷의 TCO 이점을 활용하게 된다.

  통합 패브릭을 통해 데이터 센터 리소스를 상호 연결시키는 방법은 데이터 센터 리소스의 비용 효율성을 극대화하는 방법으로, 가상화의 배포 및 관리를 간소화시켜 준다. 통합 10GbE 이더넷(iSCSI, NAS) 기반 스토리지는 통합 서버, 스토리지 및 네트워크 리소스를 기반으로 한 데이터 센터의 스토리지 효율성과 활용도를 향상시키기 위한 솔루션의 일환으로 서버 가상화 기술을 보완해 준다.

  물론 10GbE가 I/O 통합과 통합 패브릭 및 스토리지를 위한 더욱 강력한 대안이 되기 위해서는 여러 가지 면에서 개선이 필요하다. 다음과 같은 확장된 이더넷 사양은 이더넷 기반 Fibre Channel을 비롯하여 인터넷 프로토콜을 뛰어 넘는 전송 메커니즘을 지원할 수 있도록 10GbE의 유연성을 향상시켜 줄 수 있다.

  • 우선 순위 지정 그룹: IEEE 802.1Q 사양을 바탕으로 구현된 우선 순위 지정 그룹(Priority Groups) 기술은 동일한 물리적 케이블 상의 서로 다른 "통로(lane)" 간의 더 높은 QoS(quality of service) 제어를 가능하게 해준다. 우선 순위 지정 그룹은 대기 시간 및 대역폭과 같은 구성 가능한 QoS 성능을 보장하므로 스토리지 트래픽을 그룹 단위로 관리할 수 있다. 또한 일반적인 10Gb 이더넷 패브릭 상에서 Fibre Channel 스토리지 트래픽을 허용할 수 있도록 이더넷의 기능을 더욱 향상시켜 준다.
  • 우선 순위 흐름 제어 및 무손실 이더넷: 기존의 이더넷은 패킷을 중단하여 트래픽 체증을 관리하고 고도의 연결 기반 프로토콜로 패킷 손실로부터 데이터를 복구시켜 준다. IEEE 802.3x Pause 메커니즘은 이더넷을 무손실 패브릭으로 변환함으로써 Fibre Channel 기능을 에뮬레이션할 수 있게 해준다. 802.3x Pause 메커니즘은 포트 수준에서 작동하지만 우선 순위 흐름 제어는 우선 순위별 클래스 단위로 작동한다. 802.1p 우선 순위 흐름 제어 메커니즘은 기존의 이더넷 기술을 더욱 향상시켜 줌으로써 일반적이지만 한층 향상된 이더넷 패브릭을 통해 여러 트래픽 유형을 동시에 전송할 수 있다.
  • 우선 순위 흐름 제어 기술을 사용할 경우 이더넷은 이더넷을 통한 Fibre Channel, 고성능 컴퓨팅 및 일반 이더넷을 비롯한 다양한 트래픽을 지원할 수 있다. DCE(Data Center Ethernet) 및 CEE(Convergence Enhanced Ethernet) 지원 제품은 우선 순위 수준을 기반으로 트래픽을 중단시키는 PFC(우선 순위 기반 흐름 제어)를 사용하여 무손실 이더넷 패브릭을 구현한다. 이를 통해 이더넷 링크 내에 가상 통로가 생성되고 이러한 각각의 가상 통로에는 우선 순위 수준이 할당된다. 트래픽 체증이 높은 기간 동안에는 우선 순위가 낮은 트랙픽을 잠시 중단시킴으로써 우선 순위가 높은 작업과 VoIP 및 데이터 스토리지와 같이 신속하게 처리해야 하는 작업이 계속 전송될 수 있도록 한다.
  • 체증 관리; Pause 메커니즘을 통해 수행되는 무손실 패브릭 외에도 대규모 네트워크에는 전체적인 트래픽 체증 관리가 필요하다. IEEE 802.1Qau 사양은 이러한 전체적인 트래픽 체증에 대한 알림 기능을 지원하기 위해 개발되었다. 802.1Qau를 사용하면 네트워크 내부에서 트래픽 체증 발생 시 각 종단에 위치한 트래픽 소스에 전송을 줄이라는 명령이 수신되므로 체증이 감소한다.
EEE(ENERGY EFFICIENT ETHERNET)

  Energy Efficient Ethernet은 이용도가 낮은 시간대에 이더넷 구성 요소(NIC, 스위치 포트 등) 의 전력 사용을 자동으로 줄이기 위해 현재 개발 중인 기술로 EEE 개발이 모두 완료되면 FC 기반 스토리지보다 뛰어난 운영 비용 절감 효과를 제공할 것으로 예상된다.

FCOE

  FCoE(Fibre Channel over Ethernet)는 INCITS T11 에서 개발 중인 표준으로, 데이터 센터에서 I/O 통합을 위한 10GbE의 강화된 기능을 활용한다. FCoE는 SAN 연결성과 네트워킹을 위한 더 많은 옵션을 최종 사용자에게 제공하기 위해 Fibre Channel 프로토콜과 이더넷이라는 두 개의 첨단 기술을 접목시킴으로써 Fibre Channel을 이더넷 환경에 확대 발전시킨 기술이다. FCoE 프로토콜 사양은 이더넷을 통해 Fibre Channel을 기본적으로 연결하며, 이더넷 전달 방법(그림 6 참조)과 무관하게 작동한다. 이러한 프로토콜을 통해 모든 Fibre Channel 구축을 유지하고 FC 의 대기 시간, 보안 및 트래픽 관리 속성을 유지하는 한편 도구, 교육 및 SAN에 대한 투자를 보존함으로써 혁신적인 I/O 통합 방식을 적용할 수 있다.

                               그림 6) FCoE

  동일한 물리적 케이블에서 Fibre Channel 및 이더넷 트랙픽을 공유할 경우(또는 네트워크 격리가 필요하지만 두 가지 네트워크 부하 모두에 대해 동일 하드웨어를 구성 및 사용할 수 있는 유연성이 필요한 경우) 다음과 같은 장점이 있다.

  • 무손실 10GbE 패브릭을 통한 고성능 스토리지 액세스
  • 기존 SAN 관리 방법을 이용하여 스토리지 디바이스에 대한 투명한 액세스 보장
  • 기업 고객들로부터 입증된 Fibre Channel의 이점 및 관리 도구에 대한 지속적인 지원
  • 어댑터, 케이블 및 스위치 수의 감소로 자본, 에너지 및 냉각 비용 감소
  • 단일 패브릭 유지 관리를 통해 관리 간접비 감소
  • 네트워크 및 서버 구성의 간소화를 통해 어플리케이션의 가용성 증가

  이더넷 기반 스토리지(iSCSI, NAS)는 오늘날 전세계 데이터 센터에서 그 성능이 입증되고 있다. 이더넷 기반 스토리지는 저렴한 비용, 간편한 사용 방식 및 이더넷이 갖는 유비쿼터스적인 특징 등으로 인해 계속해서 성장하는 중이다. 서버 가상화 및 10GbE의 성장과 함께 데이터 센터 이더넷과 CEE(Converged Enhanced Ethernet)의 등장은 Fibre Channel 기반의 스토리지에 비해 이더넷 스토리지의 성장을 가속화시키고 있으며, FCoE의 잠재력과 LAN 및 SAN 트래픽의 통합으로 이더넷 기반의 스토리지가 데이터 센터 스토리지 분야에서 뚜렷한 스토리지 방안으로 발전하게 될 것임을 확신시켜 주고 있다.

October 21, 2008

효율적인 Smart Copy 기능의 FlexClone

 

요즈음 국내외 경제 상황을 보면 90년도 후반의 IMF 때보다 더 상황이 안 좋다는 이야기가 나올 정도로 극도의 침체기에 있는 것 같습니다. IT 인프라 H/W 및 솔루션 벤더들은 높아진 환율과 기업들의 프로젝 자체가 holding이 되는 경우도 빈번하게 발생하고 있고 또한 프로젝 하나에 서로 경쟁사들이 치열하게 경쟁하여 서로간의 어려운 상황을 자초 하고 있습니다.

올해 경제가 저 성장 할 것이라는 예상은 이미 여러 공인 기관에서 예상을 하였고 그러한 경제 상황에 맞춰 비용 효율적인 솔루션들과 이슈들이 부각이 될 것이라고 올해 초부터 예상을 하였습니다.

  Picture1

 

GreenIT나 IT 인프라 단순화 이슈는 이러한 경제적 이슈를 반영한 것으로 실제적으로 올해 IT업계의 핫이슈가 되고 있습니다.

스토리지를 구매 하는 고객의 입장에서 스토리지 비용을 절감하는 방안에는 여러 가지가 있을 것입니다. SAN/NAS의 별도 스토리지를 구매 하지 않고 Unified 구조의 스토리지를 구매하여 다양한 환경(SAN/NAS 등)에 적용하는 방법, Deduplication기능으로 스토리지 용량을 줄이는 방법, 백업 방법의 개선을 통한 비용 절감 등 다양한 방법이 있는데 이번에는 비용 효율적인 SmartCopy에 대해서 언급을 하고 자 합니다.

기업들마다 모두 IT 환경이 틀리고 운영하는 방법도 천차 만별입니다. 하지만 여기에서 시스템 관리자들의 공통된 사항은 아무리 안전한 방법이라도 중요한 원본 데이터를 건드리지 않는 일입니다. 그렇기 때문에 원본 데이터를 복제하여 백업 솔루션과 연계하여 백업을 하거나, 시뮬레이션이 필요한 업무 또는 테스트/개발/검증이 필요한 업무에서는 원본데이터를 복제 솔루션을 통해서 물리적 복제를 하거나 이러한 솔루션이 없으면 서버레벨에서 카피 또는 FTP를 통한 upload를 통해서 카피를 하게 됩니다.

즉, 이러한 원본 데이터 사용이 필요한 업무가 많으면 많을수록 그 만큼 원본 데이터 x N배의 물리적 용량이 필요할 뿐만 아니라 물리적 복제를 위해 시간적으로 많이 소요가 됩니다. 또한 이렇게 복제된 데이터를 사용하는 테스트/개발/검증 부서에서 수개월에 걸쳐 관련 데이터를 사용 하기 때문에 전체 스토리지 용량을 관리하는 관리자는 실제 중요한 업무에 할당할 용량이 없어 애를 먹는 경우가 많습니다.

만약 위의 문제들을 해결할 수 있는 복제 솔루션이 있다고 하면, 고객은 스토리지 물리적 용량 비용 절감, 복제의 시간적 문제 해결, 나아가 전체 상면 비용 및 전력량 소비량의 절감의 효과를 누릴 수가 있습니다.

넷앱에서는 FlexClone이라는 Smart Copy 기능을 제공 합니다.

 Picture2

FlexClone은 Writable Snapshot 개념으로 snapshot을 생성 후에 그 기반 위에 가상의 볼륨을 생성하여 writable하게 만들어 주는 기술로 FlexClone 볼륨을 마운트한 서버에서는 일반 볼륨 처럼 Read/Write를 동일하게 수행 할 수 있고 스토리지에서는 Write가 수행된, 즉 변경된 데이터만 관리를 함으로써 용량을 획기적으로 줄이면서 여러 벌의 그 시점이 동일한 볼륨을 만들 수가 있습니다.

Picture3 

FlexClone은 Snapshot을 기반으로 생성되기 때문에 기존 원본 볼륨과 같은 block을 point로 addressing을 하고 새로 Write되는 데이터, 즉 변경된 데이터는 가장 가까운 free block에 Write되고 관리가 됩니다.

FlexClone 볼륨을 Read시에는, 변경되지 않은 데이터는 원본 볼륨의 block을 읽어 오기 때문에 원본 볼륨의 실 서비스에 약간의 영향을 미칠 수 있습니다. 그렇기 때문에 가장 이상적인 FlexClone의 구현 방법은 물리적인 복제 볼륨에 FlexClone을 생성하여 다양한 용도로 사용하는 것입니다.

예로 DR 구현시, DR 센터의 스토리지에서 FlexClone을 사용하여 개발/테스트/검증 용도로 사용 할 수 가 있습니다. 또한 주 센터 스토리지에서 내부 복제 볼륨을 생성 한 후, FlexClone을 생성하여 사용 할 수가 있습니다.

Picture4 

요즈음 GreenIT 이슈가 부각 되면서 서버 가상화 시장도 활성화 되고 있습니다. 즉 서버 부하가 적은 서버들을 가상화 서버 몇대로 가상화하여 공간 비용, 상면 비용, 및 전력량 등을 줄이고자 하는 노력입니다.

FlexClone 같은 Smart Copy는 이러한 가상화 환경에서 더욱 더 비용 효율적인 구성이 가능 하게 합니다. 즉, VMWARE/Citrix/Hiper-V 같은 가상화 솔루션을 사용하여 단일 물리적인 서버에 여러 멀티 VM(가상머신)을 설치 하게 되는데, VDI 같은 가상 데스크탑 환경을 구축 한다고 하면, 동일한 OS의 동일 환경 구성의 VM이 여러 개가 존재 하게 될 것입니다. 이때, 하나의 볼륨만 생성하여, 이를 기반으로 여러 개의 FlexClone을 생성하여 각각의 VM에 연결하여 사용 할 수가 있습니다. 즉, 하나의 VM의 OS및 데이터 파일이 100GB가 필요하다고 하면, 10개의 VM을 만들기 위해서 물리적으로 1000GB (1TB)가 필요하지만, FlexClone을 사용하면, 100GB + 알파 (변경된 데이터 용량)만으로 구성 할 수가 있습니다.

Picture5 

올해 IDC가 전망한 trend 중의 하나는 가치 중심의 멀티 생태계의 존재 입니다. 과거에는 H/W 중심의 획일적인 구성에서 이제는 가치 중심의 솔루션 중심이 대세가 되고 결국 가치 중심의 인프라 및 경쟁 구도가 생성이 된다고 전망 하고 있고 실제로 많은 사이트에서 고객의 요구 사항에 대한 솔루션 중심으로 구도가 재편되고 있습니다.

FlexClone과 같은 Smart Copy 솔루션은 고객에게 데이터의 활용과 비용적인 측면에서 많은 가치를 제공 할 수 있는 솔루션으로 GreenIT 같은 비용 절감을 위한 핵심 기술로 자리 잡고 있습니다.

October 12, 2008

스토리지 효율화 - 첫번째 이야기

 

최근에는 Storage Economics라는 용어도 회자되고 있는 것을 보면, 최근의 일련의 금융 사태로 인해 스토리지 영역뿐 아니라 전 부문에 걸쳐 비용이 점점 더 이슈가 되는 것 같습니다. 사실 비용에서 계속적으로 이야기가 되는 것은 이번 글에서는 최근 경제 상황도 있고 해서, 스토리지 부문에서 비용절감을 할 수 있는 방안을 스토리지 효율화라는 제목으로 한번 살펴 보고, 현재 시장에 나와 있는 스토리지 효율화 기술에는 어떤 것이 있는지 살펴 보고, 그 활용 방안에 대해서 살펴 보기로 하겠습니다.

스토리지 효율화에는 여러 가지 방법이 있을 수 있겠지만, 먼저 물리적인 스토리지 시스템 효율화와 데이터 효율화)에 대한 방안에 대해 살펴 보도록 하겠습니다.

물리적인 스토리지 시스템 효율화

가장 먼저 살펴 볼 내용은 우선 데이터를 저장하고 있는 스토리지 하드웨어 자체에 대한 효율화입니다. 하드웨어를 효율화 한다는 것은 다음의 2가지를 먼저 꼽을 수 있을 것입니다.

1) 스토리지 통합으로 물리적인 스토리지 수 감소

부서별 혹은 업무별로 분산되어 있는 여러 대의 스토리지 시스템을 하나 혹은 두 대의 스토리지로 통합하여 물리적인 스토리지 수를 줄이는 방안입니다. 물리적인 스토리지가 줄게 되면 우선 가장 먼저 관리 비용(관리 인원 및 관련 비용) 및 운영 관련 비용 (전원, 공조, 공간, 유지 보수 비용 등)을 줄 일 수 있습니다.

가장 대표적인 것이 2000년 초에 FC 네트워크를 기반으로 한 SAN스토리지로의 통합이라고 할 수 있겠고, 최근에는 SAN, NAS, iSCSI를 하나의 스토리지에서 지원이 가능하도록 통합한 Unified 스토리지 제품 기술이 벤더들 사이에 눈에 띄는 추세하고 할 수 있겠습니다.

image 

2) 계층화를 통한 스토리지 재 구성 및 데이터 재 배치

스토리지에 저장된 데이터를 QoS 또는 데이터 중요도에 따라 분류해서 재 배치하는 것입니다. 가장 대표적인 방법은 데이터를 성능 요구 사항이나, 중요도에 따라 재 분류 하여, 고 성능이 요구 되지 않는 어플리케이션 데이터는 보다 성능이 낮은 스토리지 시스템으로 이전 운영하는 것입니다. 가장 일반적인 예를 보면, 하나의 스토리지 시스템에서 낮은 RPM의 Disk를 사용하는 스토리지 시스템 혹은 디스크 그룹 영역으로 이전 운영하는 것입니다. 15K RPM의 HDD가 7.5K RPM HDD에 비해 2배에서 4배까지 많은 전원을 사용하는 것을 고려할 때, 이러한 방법으로 데이터를 재 배치 하게 되면, 우선, 고성능의 스토리지 공간을 보다 효율적으로 사용할 수 있으며, 관련된 운영 비용(전원)을 절감 할 수 있게 됩니다. 또 다른 예는 과거에는 DB/ SQL과 같이 block레벨 처리가 필요한 어플리케이션을 위해서는 FC를 기반으로 한 고 비용의 SAN 스토리지를 구성 할 수 밖에 없었지만, 최근에는 SAN과 같이 block단위 처리를 지원하면서 구축 비용이 훨씬 저렴한 iSCSI를 기반으로 하는 제품들을 벤더들이 제공하고 있으므로, 어플리케이션 데이터 분석을 통해, 고 성능 처리가 필요하지 않는 데이터들은 기존의 SAN네트워크로부터 분리하여, iSCSI기반의 스토리지 구성을 고려하는 방식으로 스토리지 네트워크 효율화를 고려 해 볼 수도 있을 것입니다.

최근에는 벤더들이 하나의 장비에서 FC HDD와 SATA HDD를 모두 사용 가능하도록 하므로, 하나의 장비에서 어플리케이션 요구 사항에 따라 계층화를 가능하도록 하고 있으며, 스토리지 네트워크 기술 관점에서는 iSCSI는 이미 대부분의 주요 벤더 제품들이 지원하고 있으며, 추가적으로 FCoE 기술이 대두 되고 있습니다. iSCSI와 FCoE에서는 이후에 좀 더 자세히 살펴 보도록 하겠습니다.

image

3) 보다 정확한 초기 필요 용량 산정을 통한 낭비 공간 절감

초기 스토리지 용량 산정은 아마도 모든 프로젝트에서 가장 까다로운 작업 일 것입니다. 일반적으로 향후 업무의 증가 량을 감안하여 필요 용량의 120%정도를 구매하는 것이 일반적인 관례일 것입니다. 이것을 완전히 필요한 만큼만 구매 하도록 할 방법은 현재로서는 없을 것 같습니다. 현재 최선의 방법은 필요한 만큼보다 추가 구매하게 되는 20%를 최대한 줄이는 것입니다. 20%를 최대한 줄일 수 있도록 하는 기술은 Thin Provisioning기술일 것입니다. Thin Provisioning기술의 핵심은 물리적인 공간 보다 많은 공간을 사용자에게 보이도록 한다는 것입니다. 즉 물리적으로 10TB를 가지고 있다고 하더라도, 한 명의 사용자에게 20TB 볼륨 하나가 있는 것처럼 할당 해 줄 수 있고, 또는 20명의 사용자에게 각각 1TB씩 할당 해 줄 수 있다는 것입니다. 두 번째 Thin Provisioning기술의 핵심은 사용자에게 할당된 볼륨의 크기를 자유로이 늘렸다, 줄였다 할 수 있어야 합니다. Thin Provisioning기술을 사용하게 되면, 예측이 어려운 상황에서 보다 적은 스토리지를 구매하여, 서비스를 시작 할 수 있게 되며, 초기 용량 산정이 잘못 되어, 공간이 부족한 경우, 덜 사용하는 어플리케이션 볼륨에서 공간을 회수하여, 부족한 어플리케이션 볼륨으로 할당해 주는 방식으로 운영 할 수 있습니다.

image

최근 1년 사이에 대부분의 주요 스토리지 벤더들이 Thin Provisioning 지원을 발표하여 보다 많은 고객분들이 이 기술의 혜택을 보실 수 있으리라 생각이 됩니다. 단 모든 스토리지의 Thin Provisioning기술이 운영 중 볼륨 크기 변경을 지원하는 것이 아니므로, Thin Provisioning기술 선정 시 주의 하시기 바랍니다.

오늘은 물리적인 스토리지 시스템 효율화 방안에 대해서 살펴 보았습니다. 다음에는 물리적인 스토리지 시스템에 저장되는 데이터 효율화 방안에 대해 살펴 보도록 하겠습니다.

September 23, 2008

데이터센터의 혁신 - 이젠 그린 IT다.

데이터센터 혁신을 통한 신성장 동력그린 IT 간다

최근 몇 년 사이 서버, 스토리지, 네트워크 등 IT 인프라 급증으로 인해 데이터 센터 관리자들은 공간과 전력 절감이라는 과제에 직면하고 있다. 미국의 통계 자료를 보면 데이터 센터의 연간 전력 소모량은 2000년에서 2006년 사이 두 배로 증가해 440억 kWh에 달하게 되었다는 조사 결과가 있다. 데이터 센터의 전력과 공간을 확보하고 그린 IT를 구현하기 위해서는 차세대 데이터 센터로 ‘데이터센터 혁신’을 추구해야 한다. 특히 많은 기업들이 서버 가상화 및 스토리지의 전략적인 선택을 통해 전력, 냉각비용 및 공간 활용을 확충할 필요성이 높다고 보고 있다.

급변하는 비즈니스 요구에 신속하게 부응할 수 있는 비용 효율성, 유연성 및 확장성이 뛰어난 혁신적인 데이터 센터는 오늘날의 시장에서 크나큰 경쟁력이 될 수 있다. 특히 근래 들어 블레이드와 가상화 소프트웨어를 통한 물리적 서버 통합에 이목이 집중되고 있다. 스토리지 시스템은 데이터 센터에서 두 번째로 전력과 공간을 많이 차지하고 있으므로 가상화 및 스토리지 통합을 통한 효율성 증대는 그린 IT를 위한 또 다른 주요 기회이다.

전세계적으로 데이터센터 혁신을 가속화하고 있는 트렌드는 크게 네 가지로 나눠볼 수 있다. 가상화, 백업 재설계, 이더넷 스토리지, 경제성이 바로 이 요소들이다.

서버 가상화 기술의 도입

일반적으로 기업의 IT 조직은 예산의 70~80%를 기존 시스템과 어플리케이션의 관리 비용으로 소비한다. 또한 대부분의 데이터센터는 활용도가 낮은 수많은 서버들 때문에 값비싼 컴퓨팅 자원을 낭비하고 있으며, 이들의 유휴 자원을 관리하기 위하여 불필요한 시스템 관리 비용을 지불하고 있다. 이것에 대한 문제의식의 확산과 지속적인 해결 방안 모색의 결과가 가상화다.

서버 가상화는 기업의 IT 인프라 중 핵심이면서, 비용 및 전력 사용에 있어서 절대적인 비중을 차지하고 있는 데이터센터의 효율성을 대폭 향상할 수 있는 기술이다. 서버 가상화 솔루션을 적용하게 되면 서버 및 관리의 통합이 가능해지므로 직접적인 서버 비용의 절감은 물론 전력 절감도 가능하다. 또한 데이터센터의 복잡성을 단순화 시키고 한층 효율적으로 관리할 수 있다는 장점을 가지므로 데이터센터 혁신을 위한 필수 조건이기도 하다.

이미 몇 년 사이에 서버 가상화 기술은 세계적으로 대세가 되었다. 포춘지 선정 1000대 기업의 80-90%가 VMware 서버 가상화를 활용하고 있으며, 이는 연간 100% 이상 성장할 것으로 내다보고 있다. 이에 따라 약 2011년경에는 가상 서버와 물리적인 서버가 거의 비슷한 시장을 형성하게 될 것이다.

그러나 서버 또는 데스크탑 가상화만을 구현하는 것은 절반의 성공에 불과하다. Gartner와 IDC에 따르면 진정으로 가상화된 환경을 구현하려는 경우 스토리지를 솔루션의 일부로 간주하고 스토리지 통합을 통한 완벽한 엔드 투 엔드 환경을 구축해야 한다. 이를 통해 제품, 서비스 및 프로젝트 출시 시기를 앞당기는 것은 물론 스토리지 전력, 냉각 및 공간을 50%까지 절약하고 전체 데이터 센터 비용이 가능하다. 성능 저하나 추가 스토리지에 대한 투자 없이 가상화된 환경을 확장하고 증가하는 데이터를 관리할 수 있다.

    그림> 가상 머신과 물리적 서버 성장률

 스토리지 통합 기술을 적용하게 되면 물리적인 서버 간 가상 머신을 이동할 수 있는 네트워크 스토리지를 사용 할 수 있다. 이를 통해 만약 가상화된 서버에 장애가 발생하더라도 장애가 난 서버에서 다른 대기하고 있던 서버로 이동시켜줄 수 있으므로 신속한 서비스 재개가 가능하기 때문에 고가용성을 보장한다. 스토리지 통합이 적용되어 있지 않을 경우 데이터 및 서비스의 복제 및 복구에 짧게는 몇 시간, 길게는 수십 시간씩 걸리지만, 스토리지 통합이 적용되면 한 시간 내에도 가능해질 정도로 복구 시간을 절감할 수 있다.

 이와 함께 가상화 환경에 최적화된 백업, 재해복구, Thin Provisioning 및 디스크 중복 제거 기술을 적용하면 성능 및 안정성, 디스크 용량 절감이 가능하게 되어 관리, 장애 포인트, 전력 비용이 한꺼번에 절감되는 효과를 누리는 장점도 가진다.

 글로벌통신 서비스, 네트워크 IT, 웹호스팅 등을 서비스하고 있는 세계적인 통신 기업인  BT의 경우 서버 가상화 및 스토리지 통합을 통해 3103여 개의 물리 서버를 단 134개로 대폭 줄였다. 이에 따라 2MW 이상의 전력 절감 및 660랙의 공간 절감이 가능해졌으며 8400개 이상의 포트를 절약하는 등 효율성을 크게 향상했다. 이와 함께 백업 시간도 종전의 96 시간에서 단 31분으로 줄어들었으며 필요에 따라 용량을 증감하는 비즈니스 모델을 적용할 수 있게 된 모범적인 사례로 꼽힌다.

디스크 기반 백업 재설계

 대부분의 기업들이 사용하고 있는 테이프 저장 방식은 백업이 가장 중요한 문제이다. 비즈니스가 더욱 확대될 수록 윈도우 백업 축소 및 복구 시간에 대처해야 하는 문제도 많아지고 있다. 이 때문에 데이터 백업 및 복구에 관련한 문제들을 해결하기 위한 방안으로 디스크 기반 솔루션에 대한 고려가 늘어나는 추세이다. 데이터 기반 백업은 백업 및 복구 성능을 획기적으로 높여줄 수 있다. 또한 시스템을 적절하게 구축한다면 이미 구축된 테이프 기반의 백업 및 복구 프로세스와 인프라스트럭처를 활용할 수 있다.

 VTL은 비즈니스 전반적인 영역에서 백업 및 복구 솔루션으로 구축되고 있다. VTL을 통해 테이프 환경과의 완벽한 통합 및 성능 조합을 기대할 수 있다. 백업 및 복구 니즈에 맞추어 최적의 VTL 환경을 구축하기 위해서는 고성능, 높은 수용량, 사용 편의성, 중복제거(디듀플리케이션)기술 및 하드웨어 압축(H/W compression)을 통한 비용 및 TCO 절감, 보안 강화, 기존 테이프 라이브러리와의 호환성 등을 따져보아야 한다.

 특히 최근 비즈니스 상황은 백업 및 복구 시 다음과 같은 기능이 요구되는데 이는 디스크기반 백업 솔루션으로 가능하다.

  • 통합 및 테이프로 데이터의 손쉬운 마이그레이션
  • 복구 시간 및 백업 시간 요구를 해결
  • 백업 및 복구 완료를 위한 안정성 보장                   그림> 연간 50%씩 증가하는 데이터

백업을 위해 튜닝되고 기존 테이프 인터페이스를 제공하는 VTL은 기존 환경의 성능, 확장성 및 통합 능력을 더욱 향상시켜 준다. 백업 어플리케이션을 조작하든 부가 가치 기술을 사용하든 VTL은 장기적인 오프사이트 보존을 위해 테이프를 쉽게 이용할 수 있다.

특히 지방센터 및 원격 사무소의 경우 데이터 보호를 위한 직원이 제한적이거나 전혀 없을 수도 있으며, 핵심 목적은 백업을 반드시 수행할 수 있도록 가능한 복잡성을 제거할 수 있어야 한다. 즉, 미디어 관리의 복잡성 및 비용뿐만 아니라 구성 및 관리 오버헤드를 줄이기 위해서는 기존 테이프 백업으로는 어렵다는 의견이 많다.

VTL은 이러한 환경에서 대안을 제시해줄 수 있다. 원격 사무소에서 백업 어플리케이션을 제거하고 장기적인 보존 작업을 데이터 센터에 추가할 경우 데이터 보호와 관련된 복잡성 및 데이터 손실 기회를 크게 줄이고 규정 위반 가능성도 줄일 수 있다.

그림> 디스크기반 백업 솔루션 구성도

이더넷 스토리지 확산의 필연성

이더넷 기반 스토리지(iSCSI, NAS)는 오늘날 전세계 데이터 센터에서 그 성능이 입증되고 있다. 이더넷 기반 스토리지는 저렴한 비용, 간편한 사용 방식 및 이더넷이 갖는 유비쿼터스적인 특징 등으로 인해 계속해서 성장하는 중이다. 서버 가상화 및 10GbE의 성장과 함께 데이터 센터 이더넷과 CEE(Converged Enhanced Ethernet)의 등장은 파이버 채널(Fibre Channel) 기반의 스토리지에 비해 이더넷 스토리지의 성장을 가속화시키고 있으며, FCoE의 잠재력과 LAN 및 SAN 트래픽의 통합으로 이더넷 기반의 스토리지가 데이터 센터 스토리지 분야에서 뚜렷한 스토리지 방안으로 발전하게 될 것임을 확신시켜주고 있기도 하다.

 현재 이더넷 기반 스토리지의 지속적인 성장의 요인은 여러 가지로 꼽을 수 있다. 먼저 저렴한 비용의 상호 연결 기능이다. 프로덕션 볼륨과 경쟁적인 시장 환경에서 이더넷은 가장 저렴한 스위치 및 어댑터를 지속적으로 제공할 수 있다. 두 번째로 유비쿼터스 연결이 가능하다는 것이다. 현재 출시되고 있는 거의 모든 컴퓨터 시스템에는 이더넷이 내장되어 있으며 대부분의 데스크탑 컴퓨터에는 1GbE NIC가 포함되어 있다. 점점 더 많은 서버에서 마더보드에 LAN을 통합하고 고성능 서버 및 블레이드 기반 시스템으로 기본 10GbE를 지원하고 있으므로 향후

그림> 파이버채널과 이더넷 스토리지의                 환경에서 더욱 장점을 가질 수 있을        용량 기준 점유율                                                 것이라고 본다.

또한 상호 운영성이 이미 검증되었다는 점도 장점이다. 처음부터 이더넷 네트워크는 어댑터, 허브, 스위치 및 라우터 등의 다양한 공급업체 제품 간의 상호 운용성을 보장하고 있다. 여러 공급업체 간에 입증된 상호 운용성은 현재의 10GbE에서 향후 40GbE 및 100GbE에 이르는 연속적인 연결 속도 향상과 함께 앞으로도 계속해서 이더넷의 중요한 장점이 될 것이다. 이더넷 기반 제품에 대한 테스트 및 호환성 요구 사항은 Fibre Channel에 비해서도 매우 적다.

또한 이더넷 기반 스토리지는 추가 관리 툴 또는 Fibre Channel에 필요한 것과 동일한 수준의 교육이 필요하지 않으며 기존 이더넷 네트워크 관리 환경에 바로 통합될 수 있어 관리가 용이다다. 이와 함께 기업 고객들이 수년간 사용하고 있는 통합 스토리지 시스템 환경에 유리한 통합 멀티프로토콜 스토리지 시스템이다. 예를 들어 5년 이상 넷앱 고객들은 이더넷 기반(iSCSI, NFS, CIFS) 솔루션과 동일한 플랫폼에 Fibre Channel SAN을 추가하고, 파일 기반 스토리지 및 블록 기반 스토리지의 데이터를 구축, 관리 및 복구할 수 있는 유연성을 통해 통합 아키텍처를 사용하여 변화하는 요구 사항에 대처하고 있다. 그 결과 IT 작업은 간소화되고 직원 및 자산의 생산성이 크게 향상되는 효과를 누릴 수 있었다.

그림> 이더넷 기반 스토리지의 다중 네트워크 및 구성 요소

경제적 상황

전세계적으로 낮은 경제 성장율을 보이고 있으며 고유가•환율변동•친환경 바람으로 각 기업마다 투자를 최소화하면서도 효율성 강화 및 저전력이 기업 경쟁력의 핵심으로 떠올랐다. 서버, 스토리지, 데이터 센터, 반도체, 소프트웨어, 휴대형 기기, 네트워크 인프라까지 저전력•저에너지가 곧 고효율로 각광받고 있다.

특히 저전력은 전력비용에 대한 부담이 가중되면서 서버, 네트워크, 스토리지를 자동화함으로써 전력 사용량을 크게 줄일 수 있도록 하여 저전력과 에너지효율을 구현할 수 있는 시스템, 기술 및 제품에 대한 관심이 높다. 대기업 계열의 신규 데이터센터 구축이 잇따르며 에너지 절감적인 IDC 설계가 블레이드, 가상화와 맞물리며 새로운 수요처로 주목 받고 있는 시점이다. 가상화 또한 앞서 살펴본 대로 데이터센터의 전력 비용 절감에 큰 기여를 한다.

최근 국내에서도 저전력, 친환경 성장을 중시하는 ‘그린노믹스’가 국가 비전으로 떠올랐다. 이에 수많은 회사와 단체, 조직에서 보다 효율적인 IT 인프라를 위한 노력에 매진하고 있다.

데이터센터 혁신을 가능하게 하는 기술들

데이터센터 혁신을 가능하게 해주는 기술들로 다음과 같은 기술들이 대표적이다.

Ÿ 프로비저닝(Thin provisioning) - 씬 프로비저닝은 스토리지 자원 관리의 방법중 하나로, 근본적으로 불필요한 스토리지 추가를 막고 리소스 가용성을 극대화할 수 있는 방법이다. 최근 고유가 및 경제 상황으로 인해 효율성 강화가 강조되고 있어 투자는 줄이면서도 효율성을 높일 수 있는 솔루션으로 주목받고 있는 기술이다. 씬 프로비저닝은 가상화 기술을 통해 스토리지 내부 자원의 물리적인 할당을 관리할 수 있다. 즉 스토리지 디스크를 가상화 하여 호스트 시스템이 필요한 용량을 한번에 다 구입하지 않아도 필요한 용량이 지원되는 것처럼 인식하게 하는 것이다. 씬 프로비저닝을 활용하면 필요할 때 마다 스토리지를 늘이면 되므로 불필요한 스토리지 구매를 줄일 수 있다. 특히 수정되는 블록만 따로 저장하는 방식으로 Read-write가 가능하여 보여주기만 되는 등 획기적인 발전을 거듭하고 있다.

그림> 씬 프로비저닝

Ÿ 데이터 중복제거(디듀플리케이션; Deduplication): 압축 기술은 테이프 드라이브에서 사용되는 것과 비슷한 데이터 감소 기능을 제공하여 전반적인 용량 요구 사항을 줄여 준다. 중복 제거 기술은 보다 뛰어난 고급 알고리즘을 이용해서 데이터 감소 효과를 더욱 향상시켜 준다. 일반적인 백업은 기본적으로 중복 수준이 매우 높다. 즉, 전체 백업을 수행할 때마다 이전 백업과 거의 동일한 파일들을 계속 백업하게 된다. 이러한 파일들을 거의 변경되지 않은 것들이 대부분이다. 증분 백업을 수행하더라도 마지막으로 백업을 수행한 시점으로부터 극히 일부만 변경된 많은 파일들이 포함될 수 있다. 중복 제거 기술은 20:1(95%)의 공간 절감 효과를 제공하며, 테이프에 비해 필요한 디스크 용량을 크게 줄여 줄 수 있다.

Ÿ RAID DP(6): 이중 디스크 오류에 대비한 최상의 보호가 가능하다. 디스크 드라이브의 용량이 커짐에 따라 때로는 디스크 관련 오류를 예방하는 일이 시스템 가용성 유지와 지속적인 어플리케이션 운영에 있어서 커다란 비중을 차지하기도 한다. 종래의 RAID 보호 방식으로 스토리지 시스템이 충분히 복구되긴 하지만 RAID 그룹 하나에 디스크 드라이브 오류가 이중으로 발생할 가능성이 높아지면서 몇 가지 타당성 있는 우려를 낳고 있다. RAID 6를 구현한 RAID-DP는 데이터 손실을 막기 위한 이중 패리티 RAID 보호 기능으로, 단일 패리티 RAID와 비교했을 때 성능 오버헤드에 거의 차이가 없고 추가 비용이 들지 않는다. RAID-DP를 활용하면 과도한 이중화 구성 비용을 들이지 않고도 드라이브 오류가 추가로 발생했을 때 데이터 손실이 방지된다. 이 단순한 솔루션 사용 시 두 번째 패리티 드라이브가 RAID 그룹 각각에 추가되고 이 드라이브의 패리티는 첫 번째 패리티 드라이브와 다르게 계산된다. 두 번째 패리티 드라이브에서는 대각 스트라이프를 활용하며, 이중 드라이브 오류 발생 시 재구성에 필요한 정보가 여기에서 제공된다.

데이터센터 혁신, 그린 데이터센터 구현으로 이어진다

그린 테크놀로지(Green Technology: 녹색기술)는 친환경 기술을 뜻하는 것으로 속도와 성능의 경쟁을 뛰어넘어 에너지 효율, 자원 재활용, 환경개선 등에 초점을 맞춘 기술이다. 올해 그린 테크놀로지가 급부상한 것은 온난화로 대표되는 환경문제, 에너지 고갈 문제가 갈수록 심각해지며 그 부작용이 가시화되는 현상과 맞물려있다. 전세계적으로 '지속 가능한 성장'에 대한 관심이 높아지면서 전력 낭비 및 이산화탄소 배출 등을 줄이도록 하는 규제가 강화되고 있는 시점이기도 하다.

이미 유럽연합(EU)과 미국, 일본에 이어 중국까지 유해물질 사용을 제재하는 환경규제를 강화하고 있어 친환경은 경제 전반으로 확산되는 추세이다. 이에 글로벌 기업들은 강화되는 환경규제에 수동적으로 대응하기보다는 친환경을 경영 전반에 도입하는 전략을 내놓고 있다. 가트너는 최근 보고서를 통해 “환경을 고려하지 않으면 미래가 없을 정도로 친환경 기술개발이 기업의 절실한 과제가 됐다”고 말한바 있다. 그린 테크놀로지가 선택이 아닌 경쟁력을 위한 필수요건임을 보여주는 부분이다.

특히 저전력은 전력비용에 대한 부담이 가중되면서 서버, 네트워크, 스토리지를 자동화함으로써 전력 사용량을 크게 줄일 수 있도록 하여 저전력과 에너지효율을 구현할 수 있는 시스템, 기술 및 제품에 대한 관심이 높다. 최근 대기업 계열의 신규 데이터센터 구축시 에너지 절감적인 IDC 설계가 필요한 시점이다.

혁신적인 데이터센터는 단순하게 수요에 맞추어 디스크 및 스토리지 시스템을 확대하는데 그치지 않고 전력, 쿨링, 공간 등 데이터 센터 한계를 뛰어넘을 수 있는 요구 조건들에 대응할 수 있도록 접근하도록 해준다. 장비 팬에 전력을 공급하는 데 필요한 에너지를 절감하고 캐비닛 주변의 짧은 공기 순환을 제거하기 위한 고압 냉각 룸 등 새로운 기법의 쿨링 시스템 발전 역시 데이터센터 전력 절감 및 그린 데이터 센터로의 전환에 크게 도움이 되고 있다.

앞서 살펴본 대로 데이터센터 혁신을 통한 효율성 제고는 기업 이미지를 향상하고 친환경 규제를 만족시킬 수 있는 방안일뿐더러 그린 데이터센터 도입을 통해 효율성도 강화할 수 있어, IT 업계 전반적으로 그린 테크놀로지에 맞춘 데이터 혁신의 필요성이 더욱 강화되고 있다.

September 03, 2008

TV 리얼 버라이어티 프로그램과 스토리지 시장

 

TV 리얼 버라이어티 프로그램
몇 년 전에 유행하던 TV 예능 프로그램들은 남녀 연예인들간의 만남을 주제로 한 장미의 전쟁, 연애편지, 그리고 X맨 등이었습니다. 그러나 최근 예능 프로그램의 대세는 주말에 공중파에서 방송되는 별도의 설정 없이 있는 그대로 연예인들의 숨은 모습을 보여주는 M본부의 "무한도전", K본부의 "1박2일", 그리고 최근 시작한 S본부의 "패밀리가 떳다" 등 소위 리얼 버라이어티 프로그램들입니다.  


알고 계시는 것처럼, 먼저 시작한 프로그램이 시청자들의 관심으로 높은 시청률을 보이자, 다른 방송사에서도 거의 같은 내용의 대응 프로그램을 선보이고 있습니다. 그래서, 최근에는 프로그램간에 따라 하기 혹은 표절 시비가 많은 것도 사실입니다. 단순하게 따라 하기 만으로는 정상에 오를 수가 없다고 합니다.  벤치마팅을 통한 새로운 결과물에 대한 재창조가 필요하다는 것이죠. 그렇지 못하고 따라하기만 한다면 S본부의 "라인업"처럼 폐지될 수 밖에 없습니다.  (1박 2일 vs 라인업, 같은 출발·다른 결말…"명암 엇갈린 3가지 이유?")

뒤늦게 시작한 대부분의 리얼 버라이어티 프로그램들은 대부분 노골적 따라하기에 한 두가지의 차별화로 나름 대로의 인기를 얻고 있습니다.

K본부의 "1박2일"의 경우, ‘독도편’에서 그 곳을 지키는 분들에게 자장면을 손수 만들어준다거나, ‘가거도편’에서 오지 학교를 찾아 아이들에게 피자를 만들어주는 장면 그리고 '백두산편'에서 감동을 전달하였습니다. 

S본부에서 얼마전에 새로 시작한 "패밀리가 떴다"의 경우, 시골에 살고 계신 노인분들이 여행을 갈 수 있도록 1박2일 동안 그 집에서 생활하면서 좋은 모습을 보여주고 있습니다 . (개인적으로는 3개의 공중파 리얼 버라이어티보는 재미로 주말을 보내고 있다고 해도 과언이 아닙니다. 물론, 집사람과 애들에게는 미안하지만요.)

결국, TV의 리얼 버라이어티 프로그램들은 "강한 자가 살아남는게 아니라 살아남는 자가 강한 것이다" 라는 환경에서 강한자가 되기 위해서 더욱 치열한 경쟁을 하고 있습니다. 

여기서 알 수 있는 것은 "우리 따라했어요" 식의 따라 하기와 표절이라고 하더라도 시청자들께 감동과 재미를 줄 수 있다면, 그것은 큰 문제가 되지 않는다는 겁니다. 물론, 여기에는 프로그램 제작자들의 보이지 않는 노력이 반드시 필요할 것입니다.

스토리지 시장
최근, 스토리지 시장에서의 주된 변화를 최근 발표된 제품과 솔루션을 통해서 보도록 하겠습니다. 최근에 EMC에서는 새로운 스토리지를 발표하였습니다. 다른 제품 라인이 있었는데도 불구하고 제품을 발표한 이유는 NetApp을 비롯한 다른 경쟁사에서 좋은 실적을 보이고 있으니, 이 시장에 참가해 보겠다는 의도로 보입니다.
좋아 보입니다. 많은 회사에서 많은 노력을 하다 보면, 그 시장 자체의 규모가 커질 수 있기 때문입니다.

Unified Storage
그런데, EMC가 새롭게 제품을 출시하면서, 공교롭게도 "Unified Storage" 라고 발표를 하였습니다. NAS와 iSCSI를 동시에 지원할 수 있기 때문이라고 합니다. 고객의 요구 사항이 단일 스토리지 플랫폼에서 NAS와 iSCSI를 모두 필요로 한다는 요구 사항을 수용하겠다는 의지로 보입니다.

NetApp은 모든 제품군이 2002년 부터 NAS, SAN를 한 스토리지 플랫폼에서 지원하는 Unified Storage 를 소개해 왔습니다. (iSCSI의 경우, SNIA에서 표준 발표와 동시에 지원) 고객분들이 원하시는 구성을 먼저 파악하고 솔루션을 공급한 결과 최근 Gartner 조사 자료에서도 알 수 있듯이 NetApp의 NAS/Unified Storage 시장의 70% 이상을 점유하고 있습니다.  NetApp iSCSI + NAS = IP Storage Networking Leader (ESG)

RAID 6
다음으로 살펴 볼 것은 RAID 기술입니다. 최근에 발표된 스토리지 제품들은 RAID 6 기술을 채택하고 있습니다. 이 기술은 단위 HDD 용량이 1TB까지 증가함에 따라서, 한 HDD 장애 시 RAID Rebuild 시간이 길어짐에 따라서, 그 시간 동안 RAID Group내 또 다른 HDD의 장애 시, RAID Group내의 모든 데이터를 손실할 수 있다는 위험에서 고가의 RAID 1 구성과 안정성을 제고해봐야 하는 RAID 5보다는 비용 효과적인 측면에서 매우 우수합니다.

NetApp에서는 이미 2004년부터 RAID 6 기술을 출시하여 기업의 소중한 데이터 보호를 위하여 고객께 제공하고 있습니다. RAID 6 (RAID-DP)

EMC는 자사의 제품에 RAID 6 기술에 대한 지원을 발표하면서, 기존의 주장을 뒤바꿨습니다. NetApp을 경계하기 위해서인지 RAID 6 기술은 필요하지 않고, RAID 5 및 고가의 RAID 1 기술만을 고객에게 일방적으로 제공하였습니다. 늦은 감은 있지만 지금이라도 기술적으로 RAID 6 기술을 채택한 것은 고객의 입장을 생각했다는 점에서 그나마 다행으로 생각됩니다.

Thin Provisioning
최근 기술 중에 한가지 더 Thin Provisioning이 있습니다. 물리적으로 구성되어 있는 용량보다 더 많은 용량을 논리적으로 구성하여 용량을 필요로하는 서버에 할당하는 것이죠. 이 기술을 이용하면 실제로 많은 공간을 필요로 하지 않지만, 초기에 많은 공간을 필요로 하는 현업의 요청 사항들을 모두 충족시킬 수 가 있습니다. 나중에 실제로 필요로 하는 공간의 차이가 발생할 경우에는, 그 시점에 여유 있게 공간 확보를 할 수 있습니다.  경쟁사들은 최근에서야 이 기술을 발표하였습니다.

NetApp은 2004년 FlexVol을 이용한 Thin Provisioning을 출시하여, 고객분들의 실제 운영에 많은 장점을 제공해오고 있습니다. FlexVol (Thin Provisioning)

Green IT
위에 언급되어 있는 세가지 솔루션들은 - Unified Storage, RAID 6, Thin Provisioning- 최근에 각광받고 있는 Green IT 구축에 없어서는 안될 요소들로 꼽히고 있습니다. 결국, Green IT를 위한 솔루션들을 NetApp에서는 훨씬 이전부터 고민했다고 말씀드릴 수 있겠습니다.

TV의 리얼 버라이어티 프로그램과 스토리지 시장
그렇다면 리얼 버라이어티와 스토리지 경쟁의 공통점은 무엇일까요 ?
리얼 버라이어티 프로그램처럼 다른 경쟁사들이 NetApp에서 이미 발표하여 고객분들이 실제 업무에 사용하고 있는 솔루션들을 경쟁사들이 앞다투어 노골적으로 따라 하고 있다는 것입니다.

그러면, 차이점은 무엇일까요 ?
그것은 고객(시청자)을 먼저 생각하는가 ? 혹은 감동을 줄 수 있는가 ? 라고 생각됩니다. EMC가 높은 시장 점유율(시청률)을 보이고 있다고 하더라도, 그것이 고객의 감동이 높다라고 할 수는 없습니다. 단순 따라 하기만을 거듭한다면, 고객의 선택은 결국 바뀔 것입니다. 
NetApp은 리얼 버라이어티 프로그램의 효시라고 할 수 있는 "무한도전"이 베이징 올림픽 특집을 통해서 시청자들께 큰 감동을 준 것처럼 고객을 위해서 끝없이 고민하고 운영 시스템을 위한 중복제거 기술 및 FCoE 지원과 같은 업계를 선도할 새로운 기술은 무엇인지에 대해서 계속해서 고민하고 해결하려고 노력하고 있습니다. 

'우리 따라했어요'는 어느 수준까지는 올 수 있습니다. 그러나, 고객을 감동시킬 수 있는 새로운 포맷과 새로운 아이디어 없는 EMC의 새롭게 발표된 제품라인은 S본부의 "라인업" 프로그램처럼 폐지될 수 밖에 없습니다.

 -. 하늘봐봐

August 18, 2008

넷앱 스토리지 사용하면 중복제거 무상 제공

넷앱 스토리지 컨설턴트로 입사한지 벌써 2년 여가 지나갑니다. "모방은 창조의 어머니" 라는 격언은 피해갈 수 없는 진실로서, 나에게도 새로운 업무에 적응하기 위해서는 방대한 기초 자료가 필요했고, 기존 포맷이나 자료들이 새로운 프로젝트와 제안서를 만들 때 절대적인 도움이 되었습니다. 물론 처음에는 참조 자료가 부족하여 새로운 것을 만드는데 지금보다 2~3배의 시간과 노력을 기울여야 했습니다.

지금은 그동안 누적된 데이터와 자료를 바탕으로 프로젝트 자료와 제안서를 만드는 시간이 많이 단축되었고, 점차 개선된 자료를 만들어 가고 있습니다. 프로젝트 마다 전혀 다른 새로운 내용을 만들 필요 없이, 기존 내용을 조금씩 바꾸거나, 제안하고자 하는 주요 부분만을 추가하여 작성하면 되었고, 필요하면 그때 그때 필요한 데이터를 찾아 복사하면서 빠른 작업이 가능해졌기 때문입니다.

http://www.symantec.com/content/ko/kr/enterprise/vision/images/photo/IMG_2094.jpg

문제는 시간이 흐를수록 복사하는 용량이 많아지고, 파일이 커짐에 따라 데이터의 용량관리가 점점 더 어려워지고 있다는 것입니다. 처음 수GB로도 충분했던 저장 공간이 불과 2년 여 만에 40GB 디스크 용량으로도 부족하게 되었고, 오래된 사용하지 않는 큰 파일들을 지워도 좀처럼 개선되지 않습니다. 더욱이 주기적으로 외장 디스크로 백업을 받고 있는 200GB 외장 디스크가 꽉 차가고 있습니다. 문제의 근원은 프로젝트/디렉터리 별로 비슷비슷한 파일과 내용으로 가득 차 있으며, 심지어 수MB 파일 사이즈에서 제목만 서로 다르다던가, 파일 이름만 다른 경우가 허다하기 때문입니다.  

이러한 문제는 저 개인의 사례로 국한 되지는 않을 것입니다. 최근 기업은 기하급수적으로 증가하는 데이터의 증가 추세에 따라, 과거에는 생각할 수 없었던 큰 용량인 수십, 수백 TB 데이터를 관리하고 백업해야 하므로 백업 관리자에게 있어 증가하는 데이터 관리 비용과 그에 따른 백업 윈도우를 맞추기 위한 노력의 고통은 상상할 수 없이 커져가고 있습니다.

그나마 한 가지 다행이라면 저 개인의 예처럼 데이터들이 전혀 새로운 유일한 특성을 가지지 않다는 점입니다. 이것은 산업별 특성에 따라 약간씩 다르게 나타나지만, 대부분의 분야에서 각각의 데이터는 서로 비슷비슷한 중복된 내용들로 저장됩니다. 특히 백업 시에는 동일 데이터에 대한 주기적인 복사가 주요 패턴이므로 데이터의 중복률은 80~90%에 이릅니다.

이러한 데이터의 특성을 이용하여 중복되는 데이터를 제거하는 기술 즉 Dedupe을 이용한다면 스토리지의 비용 효율화와 백업의 속도 개선을 획기적으로 이룰 수가 있습니다. 최근 디스크 기반의 VTL과 D2D 시장에서 Dedupe 을 적용한 제품들이 앞다투어 출시되는 것도 이러한 요구를 반영한 자연스러운 현상일 것입니다. 하지만 대부분의 제품이 Dedupe 을 하나의 솔루션으로 포장하여 고가의 라이선스 비용을 받으며 판매되고 있고, 용량 증설 시 추가적인 비용을 청구하며 그 성능 또한 만족스럽지 못합니다. 

넷앱은 이미 2년 여 전부터 주 스토리지 제품에 Dedupe을 적용해 왔고, 타사와는 전혀 다른 사상으로 Dedupe에 접근하고 있습니다. 즉, 이용자의 파일과 데이터를 가장 효율적으로 관리하기 위한 하나의 스토리지 기능으로 Dedupe 의 가치를 판단해 왔으며, RAID, Thin Provisioning, FlexVol, Snapshot 기능 등과 같이 무상으로 제공되고 있습니다. 또한 넷앱 고유의 스토리지 관리 솔루션인 WAFL과 결합하여 inode 가 가리키는 블록 포인터의 변환 방식을 통해 중복제거를 수행하므로 성능 저하를 최소화 시켰으며, 백업 스토리지에 국한되지 않고 1차 서비스 스토리지에도 적용해 사용되고 있습니다. 이미 전 세계적으로 2500+ 고객사에서 10,000 여대가 넘는 스토리지에 Dedupe 이 적용되어 높은 안정성과 성능을 증명하고 있습니다. 최근에는 넷앱 스토리지 뿐만 아니라 EMC,HP 등 타사 이기종 스토리지들을 넷앱의 스토리지 처럼 가상화 시켜주는 V-series 제품과 VTL에도 무상 적용하여 사용할 수 있습니다. 

데이터의 중복제거는 점차 사용자의 선택이 아닌 어쩔 수 없는 필수 적용 기능이 되고 있습니다. 지금 Dedupe 을 적용하고자 하신다면 이러한 점을 사전에 고려해 보시기 바랍니다.   

August 17, 2008

Grid/Cluster 스토리지 시장

 

요즈음 날씨를 보면 “과거에 언제 이렇게 더웠나” 하고 싶을 정도로 무더운 여름입니다.

이러한 무더위에 모든 부분이 지쳐서 에너지 충전을 해야 할 듯 해 보이는데 IT의 기술 발전은 이러한 날씨와 상관이 없나 봅니다. 갈수록 신제품 출시의 term이 짧아지고 있고 스토리지 분야 또한 기술 변화가 심화 되고 있습니다.

저는 넷앱의 스토리지 분야 중에서 Grid/Cluster 스토리지의 ownership을 가지고 이러한 시장의 요구 사항을 몸소 체험을 하고 있습니다. 과거 2 ~ 3년 전만 하더라도 국내에서는 Grid/Cluster 스토리지의 개념에 흥미를 느끼는 정도 였던 것 같습니다. 일반적인 스토리지로 업무를 잘 사용하고 계시면서, 성능 문제가 이슈가 되면 성능을 향상 시킬 수 있는 스토리에 관심을 갖기 마련이기 때문이지요. 하지만, 대부분의 고객 사이트의 성능 이슈는 일반적인 스토리지 안에서 충분히 해결 할 수 있는 경우가 대부분 입니다. 그리고 문제가 있어도 Grid/Cluster 스토리지로 적용 하기에 알맞지 않는 업무 패턴도 많이 있습니다. 고객 분들도 무리하게 신 개념의 Grid/Cluster 스토리지로의 도입을 안정성을 이유로 고려 하시기 꺼려 하십니다.

이러한 경향이 요즈음에는 정확하게 Grid/Cluster 스토리지의 개념을 파악을 하시고 도입의 강한 의지를 보이시는 고객 분들이 많이 늘어 났습니다. 그만큼 넷앱 뿐만 아니라 타 경쟁사들의 제품이 많이 출시가 되었고 시장에서 다양한 마케팅 효과가 나타난 결과라고 생각을 합니다.

그러면, 고객 분들은 Grid/Cluster 스토리지를 왜 고려를 할 까요?

고성능의 필요성, 대용량 확장의 필요성, 단일 볼륨 수십TB이상 확장 등 여러 가지 이유가 있겠지만, 최우선은 성능 때문에 많이 고려를 하십니다.

기존 NAS 스토리지는 컨트롤러 별로 볼륨을 관리 하기 때문에 A라는 볼륨을 서비스 하는 것은 결국 A라는 볼륨을 관장하는 컨트롤러에서 서비스를 할 수 밖에 없고 이 컨트롤러의 한계 성능을 벗어 나서 서비스를 할 수가 없습니다. Grid/Cluster 스토리지는 A라는 볼륨을 다수의 컨트롤러가 같이 공유하고 서비스를 할 수 있기 때문에 하나의 컨트롤러 성능의 한계를 벗어나서 성능을 향상 시킬 수가 있습니다. 또한 볼륨도 기존의 16TB 한계를 넘어서 수 PB까지 하나의 볼륨을 만들 수가 있고 이러한 볼륨을 다수의 컨트롤러에서 공유를 해서 서비스를 하니 고객의 입장에서는 크게 관심을 가질 만 합니다.

하지만, 기존 일반적인 스토리지 보다 파일 시스템이 다수의 컨트롤러로 구성이 될 수 있기 때문에 장애 포인트가 많아진다는 점과 장애 시 관리가 보다 어려워 진다는 점이 고객의 안정성 측면에서 주저 하는 이유이고 그렇기 때문에 H/W적, S/W적 안정성을 도입 시 면밀히 검토를 해야 합니다.

또한, 성능 및 볼륨의 확장이 커지다 보니 효율적인 스토리지 복제 및 백업 솔루션 검토 (file 또는 block 레벨 등)가 이루어 져야 하고 무엇보다 각 벤더의 roadmap을 검토하여 Grid/Cluster 스토리지라는 신기술을 어떠한 방향으로 안정적으로 발전 해 나갈 수 있는 벤더의 역량을 살펴 봐야 할 것입니다.

과거에 DAS 형태의 IT 환경에서 Network Storage (SAN/NAS 등)로 현재 거의 모든 프로젝이 진행이 되고 있으나 아직까지 DAS 형태로 사용하고 있는 환경이 많이 남아 있는 상태 입니다.

현재 스토리지 기술의 Trend는 Network Storage가 주도 하고 있으나 향후에는 Grid/Storage 같은 Scale Out 형태의 기술이 주류를 이룰 것이라고 예상을 하고 있습니다.

그렇기 때문에 한발 먼저 이러한 기술에 지속적인 관심을 가지는 것이 향후 남들보다 안정적이고 효과적인 시스템 구축에 도움이 되리라 생각을 합니다.

 

image

© NetApp, Inc.  |  "Safe Harbor" Statement  |  Privacy Policy