본문 바로가기

IT & Insight/IT News

IBM “도전, 하둡 어플라이언스”

하둡 어플라이언스 시장에 IBM이 진출한다는 내용의 기사입니다. 많은 하둡 업체들이 어플라이언스 시장에는 손을 대고 않는 시점에서 IBM의 이번 행동의 의도는 무엇이라고 볼 수 있을까요? 기업의 어플라이언스 도입은 내부적 역량을 통한 시스템 운용 및 개발에 한계가 있을 때 주로 이뤄지게 마련이고, 외부 업체의 어플라이언스 도입을 통한 이점은 시스템 운용상의 문제가 발생시 외부업체의 유지보수 시스템을 제공받는 다는 것 이외에는 크게 찾아보기 힘듭니다. 그러나 클라우델라 같은 현재의 하둡 어플라이언스 제공사들은 No guaranantee 정책을 펼치고 있는 상황입니다. 그렇다면 IBM도 이와 크게 차이나는 정책을 펼치기에는 무리가 있을 것이라는 예상을 해볼 수 있을 것인데, 기존 내부 시스템과 하둡의 연결을 통해 제공될 IBM의 어플라이언스의 기능에 또한 의문이 드는 상황에서 이번 IBM의 행보에는 의문이 들 수 밖에 없다고 할 수 있겠습니다.

 

현재의 빅데이터 시장은 그 시장성장가능성에서는 매력도가 높은 시장임은 분명하지만, 아직 개발이 이뤄지고 있는 시점인만큼 진출전략에 있어서 상당한 내부고민이 필요할 것입니다. 그 결정이 너무 늦어서는 곤란하지만 빠른 결정이 독이 될지 약이 될지는 지켜봐야할 것입니다.

 

#

 

대용량 데이터 분석을 위한 하둡 어플라이언스 시장에 IBM도 출사표를 던졌다. EMC 그린플럼 엔터프라이즈 하둡 어플라이언스, 오라클 빅데이터 어플라이언스, SAP 인메모리 어플라이언스 하나 등으로 대표되는 어플라이언스 시장을 지켜보면서 뛰어들기 괜찮다고 판단한 모양새다.

 

IBM은 4월3일(현지기준) 산호세에서 열린 기자간담회에서 더 빠른 속도와 대용량 데이터를 처리할 수 있는 하둡 어플라이언스를 발표했다. 퓨어시스템과 하둡을 결합한 ‘퓨어데이터 어플라이언스 포 하둡’ 형태로 공개됐다.

ibm_biginsights_2_1

이날 기자간담회에서 필 프란시스코 IBM 빅데이터 제품 관리&전략 수석 부사장은 ”경쟁사들과 비교해 더 편리하게 하둡을 사용할 수 있는 ‘퓨어데이터 하둡 어플라이언스’를 이번 여름에 출시하겠다”라며 “이르면 2분기 안에 고객들 앞에 선보일 수 있을 것”이라고 말했다.

 

기가옴과 더레지스터가 전한 기자간담회 현장 분위기에 따르면, 퓨어데이터 어플라이언스 포 하둡은 그동안 IBM이 발표한 빅데이터 처리 관련 기술을 끌어모은 결과물로 보인다.

 

퓨어데이터 어플라이언스 포 하둡은 하둡에 저장된 데이터를 기존 IBM의 데이터 관리 통합 플랫폼인 ‘IBM 인포스피어 데이터 익스플로러’로 탐색할 수 있으며, 대용량 정보 분석 엔진인 ‘빅인사이트’과 함께 하둡 클러스터를 처리하고 다룰 수 있다. 여기에 데이터 시각화 도구인 ‘빅쉬트’도 함께 포함된다.

 

IBM은 또한 HBase 데이터웨어하우싱 레이어도 준비했다. 그 결과 퓨어시스템 하둡 어플라이언스 사용자는 HBase와 빅쉬트를 통해 각종 데이터 정보를 하둡으로 추출해 원하는 형태로 가공할 수 있다. SQL과의 간극도 좁혔다. 하둡은 대용량 데이터 처리에 최적화됐지만, 개발자들이 사용하기 복잡하다는 어려움이 있었다. IBM은 SQL 구문으로 하둡 데이터를 관리할 수 있는 ‘빅 SQL’ 기능도 추가했다.

 

하지만 이 조합이 실제로 빅데이터 시장에서 가치를 만들어낼지는 의문이다. 소프트웨어와 하드웨어가 결합됐다고 단순히 어플라이언스라고 부르지 않듯이, 하둡을 지원한다고 해서 기존 어플라이언스가 하루 아침에 하둡 어플라이언스로 탈바꿈하는 건 아니기 때문이다.

 

빅쉬트는 IBM이 지난 2010년 5월 발표한 빅인사이트 하둡 솔루션의 일부분이다. 당시 IBM은 빅쉬트를 통해 하둡 분산 파일 시스템에 저장된 비정형 데이터를 스프레드 시트 형태로 요약해 보여줄 수 있다고 설명한 바 있다. 빅인사이트 역시 IBM이 2010년 열린 ‘인포메이션 온 디멘드(IOD)’ 행사에서 공개한 솔루션이며, 인포스피어 데이터 익스플로러는 지난해 IBM이 발표한 빅데이터 관리 솔루션이다. 퓨어시스템은 지난해 4월 IBM이 자사 하드웨어와 소프트웨어를 결합한 데이터센터용 어플라이언스다. 리눅스 운영체제로 x86과 IBM의 ‘파워 프로세스’를 지원한다.

 

문제는 클라우데라나 호튼웍스 등 하둡 관련 상용 솔루션 업체 그 어디도 하둡 어플라이언스를 만들어내지 않고 있다는 데 있다. 대용량 데이터를 비교적 저렴한 비용으로 처리한다는 맨 처음 약속 그대로 x86 같은 범용 솔루션에서도 대용량 데이터를 처리할 수 있는 기술을 연구중이다. 값비싼 돈으로 치장된 하둡 어플라이언스를 어떤 고객이 이용할지는 미지수다.

 

EMC와 오라클, SAP가 빅데이터 어플라이언스를 선보였다고 하지만 실제로 시장에서 재미를 보고 있지 않은 점도 IBM의 하둡을 위한 어플라이언스 출시가 걱정되는 이유다. 오라클은 여전히 엑사데이터 중심의 전략을 내세우고 있으며, 클라우데라의 하둡 배포판 사용에 대해서는 여전히 ‘보증하지 않는(No guaranantee)’ 정책을 유지하고 있다. 고객의 하둡 솔루션을 사용해 대용량 데이터를 처리하는 과정에서 발생하는 문제는 책임지지 않겠다는 심산이다. SAP는 인메모리 하나 어플라이언스로 빅데이터 분석용이 아닌 온라인 트랜젝션 처리(OLTP)에 집중하는 전략을 보이고 있다. 하둡은 대용량 데이터를 처리하는 데 있어 하나의 옵션일 뿐이다. 그나마 EMC는 자체적인 하둡 배포판인 ‘피보탈HD’를 통해 빅데이터 시장에 접근하는 전략을 취했다.

 

하둡 상용 솔루션을 어떻게 연동하겠다는 구체적인 전략없이 단순히 내부 시스템과 하둡을 긴밀히 연동해 이를

하둡 어플라이언스 형태로 시장에 선보이겠다는 IBM의 전략에 고개를 갸웃거리게 되는 게 이상한 일일까.

 

http://www.bloter.net/archives/148837

 

'IT & Insight > IT News' 카테고리의 다른 글

우려가 현실로?!  (0) 2013.04.09
사물인터넷도 데이터베이스로!!  (0) 2013.04.09
USB? Cloud!!  (0) 2013.04.05
구글, 한국내 하드웨어 직접 판다  (0) 2013.04.04
런처만 깔면 내폰도 페북폰!  (0) 2013.04.04