급부상하는 데이터 가상화, 주목받는 이유는?

백지영 기자 2019.12.02 10:29:44

[디지털데일리 백지영기자] 한 곳에 데이터를 모아놓는 개념의 ‘데이터 레이크(Data lake)’의 한계점이 드러나면서 최근 ‘데이터 가상화’가 급부상하고 있다.

데이터 가상화(Data Virtualization)는 물리적인 데이터 이동 없이 원천 데이터를 결합하고 활용하는 개념이다. 더 구체적으로는 인메모리에 가상의 DB를 만들어 데이터 접근 및 통합을 가능하게 해주는 방식이다.

최근 한국데이터산업진흥원이 개최한 ‘2019 데이터 그랜드 컨퍼런스’에서 엔코아는 엔터프라이즈 데이터 관리 방안의 새로운 해법으로 ‘데이터 가상화’를 내세워 주목을 받았다.

정철원 엔코아 연구개발본부 이사<사진>는 “최근 전통적인 관계형DB(RDB)의 클라우드 전환, 오픈소스, 특정 영역에서의 NoSQL 적용 등의 기술적 이슈와 함께 저비용, 데이터 기반 의사 결정 지원, 비즈니스 모델의 변화에 따른 신속한 대응 등 데이터 활용에 대한 요구사항이 커지고 있다”고 말했다.

특히 많은 기업이 구축하고 있는 ‘데이터 레이크’에서도 다양한 이슈가 발생하며 데이터 가상화의 필요성이 높아지고 있다는 설명이다.

현재의 데이터 레이크는 대량 데이터 복제로 인한 데이터 분석 비용이 증가하고 있으며, 데이터 레이크에 모아둔 데이터는 활용하기 어려운 과거 데이터가 많다. 다양한 원천 데이터 소스의 최신 데이터 재결합 등에 따라 동기화 이슈도 발생한다. 또한 개인정보와 같은 민감 정보의 복제 문제, 정제되지 않은 데이터 유입으로 인한 정합성 문제가 부각되고 있다.

결국 데이터 레이크에서는 데이터 복제와 데이터 동기화, 데이터 품질, 데이터 접근 제한 등 무수한 문제가 발생하고 있다는 것이 그의 설명이다.

정 이사는 “데이터 레이크 구축 시 발생할 수 있는 문제점을 데이터 가상화로 해결할 수 있다”며 “데이터 가상화는 원천 데이터의 실시간 통합을 위한 최적의 수단이며, 최신 데이터를 실시간으로 활용할 수 있는 환경을 제공한다”고 강조했다.

현재 엔코아는 데이터 가상화 솔루션인 ‘DV#’를 통해 다양한 데이터를 물리적인 이동 없이 하나의 데이터로 빠르게 통합해준다. 또 경쟁사와는 달리 무분별한 데이터 복제 방지로 컴플라이언스에도 대응이 가능하다.

DV#은 DB와 파일, 빅데이터를 별도의 메모리 공간에서 가상 데이터 레이어로 손쉽게 통합하고 최신 데이터를 실시간으로 활용할 수 있는 환경을 제공한다. 사용자 SQL이나 애플리케이션서 요청하는 SQL를 다양한 데이터 소스에 맞춰 재구성하고, 원천 데이터소스로부터 필요한만큼의 데이터를 수집, 메모리에 적재·가공해 결과값을 내놓는다. 무엇보다 접근 권한 제어나 이력기록, 데이터 마스킹 처리를 통해 보안을 강화하고 웹 기반의 중앙 운영 관리가 가능하다.

김범 엔코아 전략사업본부 전무는 “데이터 가상화는 온프레미스나 클라우드 환경 모두에서 갖고 있는 데이터 레이크 이슈를 해결해준다”며 “데이터 레이크를 대체하기보다 상호 보완적으로 운영이 가능한 솔루션”이라고 강조했다.

이어 그는 “‘인텔리전트 엔터프라이즈’가 되고자 하는 기업에게는 데이터 가상화가 제공할 수 있는 혜택이 많으며, 데이터 레이크에 모여 있는 데이터의 가치의 사전 검증도 가능하다”며 “최근 국내에선 의료분야 등에서 관심이 높다”고 덧붙였다.

<백지영 기자>jyp@ddaily.co.kr