[디지털데일리 이상일기자] 하둡(Hadoop)은 빅데이터 분석에 있어 각광받는 기술이지만 사용하기가 쉽지는 않다. 하지만 하둡의 성능 및 활용을 최대로 이끌어내기 위한 다양한 프로젝트가 이어지고 있어 하둡 생태계는 활성화되고 있다.
13일 서울 양재동 엘타워에서 개최된 ‘오픈테크넷 서밋 2014’에서 ‘쓰기 쉬운 하둡(Hadoop) 기반 빅데이터 플랫폼 아키텍처 및 활용방안’을 발표한 오픈프론티어랩 박치완 개발자는 “빅데이터를 활용하기 위해서는 데이터 사용자가 자주, 빨리 분석을 수행해볼 수 있어야 한다. 하지만 아직은 하둡이 기존 시스템보다 다루기 어려운 것은 사실”이라고 설명했다.
오픈프런티어랩은 국내외 오픈소스 프로젝트를 수행하는 공개SW 커미터(Committer)를 지원하는 정부지원(정보통신산업진흥원) 프로그램이다.
박 개발자는 “아파치 하둡이 소개된 이후 사용하기 어렵다는 지적을 보완하기 위해 다양한 기술이 나왔다”며 “하지만 터미널 위주의 데이터가 주를 이루다 보니 기존 환경에 익숙한 개발자들에겐 생소할 수 있다”고 설명했다.
이렇다보니 하둡 기술을 쉽게 사용할 수 있는 다양한 기술도 꾸준히 소개되고 있다.
박 개발자는 “하둡 클러스터를 쉽게 배포하고 관리해 줄 수 있는 ‘암바리(Ambari)’, 하둡관련 프로젝트를 하나로 묶어 사용할 수 있게 해주는 솔루션인 ‘클라우데라 휴(Cloudera Hue)’ 등 다양한 솔루션이 나오고 있어 하둡 생태계를 확장시키는데 도움을 주고 있다”고 설명했다.
한편 이 자리에서 오픈프론티어랩에서는 정부 지원을 받아 진행하고 있는 ‘플라밍고(Flamingo)’ 프로젝트를 소개했다. 플라밍고는 웹 기반 유저환경(UI)에서 하둡 컴포넌트를 다루는 것으로 하둡 개발환경에 생소한 개발자들고 편하게 다가갈 수 있게 해준다.
기능적으로 기존에 사용하던 맵리듀스(Mapreduce)에 통합해 워크플로우(Workflow)에 적용할 수 있고 하이브 테이블(Hive Table)은 쿼리(Query)문 없이 UI로만 가능하는 등 편의성이 강조된 기능이 채택됐다.
박 개발자는 “플라밍고에선 향후 기본적으로 제공되는 컴포넌트를 보강하는 한편 하둡 2.0 지원, 아마존 EMR 등 하둡 기반 엔터프라이즈 플랫폼을 지원할 계획”이라고 밝혔다.
<이상일 기자>2401@ddaily.co.kr
Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지
주파수 재할당대가, 정부가 부르는게 값? “산정방식 검토 필요”
2024-11-22 18:23:52유료방송 시장, 역성장 지속…케이블TV 사업자 중 SKB 유일 성장
2024-11-22 13:28:49[디즈니 쇼케이스] 판타스틱4, MCU 합류…미소 짓는 케빈 파이기
2024-11-22 12:56:31LGU+, 기업가치 제고 계획 발표…"AX 컴퍼니 구조 전환 가속화"
2024-11-22 10:18:34LG헬로 송구영 대표이사 재선임…사업 수익성 개선 '총력'
2024-11-21 18:33:01드림어스컴퍼니, 자본준비금 감액해 이익잉여금 500억원 전입
2024-11-22 14:57:25야놀자·인터파크트리플, 12월 ‘놀 유니버스’로 법인 통합
2024-11-22 14:57:10논란의 ‘퐁퐁남’ 공모전 탈락…네이버웹툰 공식 사과 “외부 자문위 마련할 것”
2024-11-22 14:23:57쏘카·네이버 모빌리티 동맹 순항…네이버로 유입된 쏘카 이용자 86%가 ‘신규’
2024-11-22 12:58:15