[디지털데일리 백지영기자] “대부분의 회사가 OLTP와 OLAP 워크로드를 운영하고 있지만, 실시간 데이터 분석은 불가능한 것이 현실입니다. 하둡 기반의 데이터 레이크 역시 데이터를 모으는데만 집중하다보니 활용에 신경을 쓰지 못하고 있죠.”
몽고DB 김준 상무는 11일 디지털데일리 DD튜브에서 열린 ‘2021 DB 이노베이션’ 버추얼 컨퍼런스에서 “몽고DB는 기존 관계형DB(RDBMS)와는 달리 다큐먼트 DB 형태로 여러 데이터를 유연하게 저장하고 원하는 시점의 데이터를 실시간으로 분석할 수 있도록 지원한다”고 강조했다.
데이터 기반의 실시간 의사결정이 이뤄지는 상황에서 기업들은 실시간으로 데이터를 분석하고 즉각적인 서비스를 제공해야 한다. 때문에 많은 기업들이 데이터웨어하우스(DW) 혹은 데이터 레이크라고 불리는 여러 백단의 시스템에 데이터를 모아놓고 분석을 하지만 사실상 실시간 분석은 불가능하다.
김 상무는 “서비스별로 약간의 차이는 있을 수 있지만 빠른 시간 내 고객에게 빠른 응답을 줘야하는 업무에는 그 많은 데이터를 실시간 형태로 분석하기엔 어렵다”며 “무엇보다 데이터를 분석하기까지 앞단의 데이터를 처리하는 과정에 너무 많은 시간이 소요되기 때문에, 모든 데이터를 분석한다는 것은 욕심”이라고 지적했다.
그에 따르면, 전체 데이터를 대상으로 실시간 분석하는 경우는 그리 많지 않다. 그는 “예를 들어 실시간으로 상품을 추천한다거나 카드 부정 사용 등 이상감지 업무의 경우 백단의 다양한 데이터를 한꺼번에 다 읽을 필요가 없다”며 “이는 특정 데이터 범위에서 얼마든지 실시간 분석이 가능한 만큼, 몽고DB는 기존과는 다른 접근 방식을 취했다”고 설명했다.
몽고DB가 정의하는 리얼타임(실시간) 데이터 분석은 트랜잭션(OLTP)와 분석(OLAP) 워크로드를 하나의 공간에 모아놓고 데이터 변경 없이 실시간 서비스로 가능한 것이다. 이를 위해 몽고DB는 OLTP와 OLAP 중간에 RTA라는 별도의 레이어를 하나 더 뒀다. 백단에 있는 데이터를 변경할 필요없이 그대로 가져다가 실시간 분석에 활용할 수 있도록 해 효율성을 높였다.
이는 ‘다큐멘트 모델’이라는 몽고DB의 특성에 따른 것이다. 그는 “다큐먼트 DB는 키밸류나 컬럼 등을 통합하는 슈퍼셋이라고 보면 된다”며 “이는 데이터를 저장하고 다루는데 있어서 효율적인 모델”이라고 말했다.
또, 분산아키텍처이기 때문에 OLTP와 OLAP이라는 두가지 타입의 워크로드를 완전히 분리시켜 수행이 가능하다. 이로 인해 두 가지 업무가 하나의 시스템에서 볼 수 있는 것도 특징이다. 스토리지 압축률도 타 DB에 비해 최대 90%까지 줄일 수 있는 것이 강점이다.
일례로 대량 포장용 제품을 판매하는 박스드(boxed)라는 업체는 몽고DB를 통해 실시간 입출고 현황을 바로 파악할 수 있게 된 사례다. 이 회사는 코로나 팬데믹으로 엄청난 트래픽을 기록하면서 실시간 재고관리 및 입출고 내역을 파악하고 바로 서비스에 반영하기 위해 몽고DB를 채택했다.
김 상무는 “분석을 위한 데이터를 만들기 전에 효율적으로 데이터를 저장하고 변경하는 부분에 중점을 둬야 한다”며 “몽고DB는 고객이 원하는 시점의 데이터를 실시간으로 보여주고, 이를 통해 인사이트를 뽑아낼 수 있게 돕고 있다”고 강조했다.