실시간
뉴스

소프트웨어

생성형 AI 시대, DB 시장 지각변동...벡터DB 각축전 본격화

[ⓒ DB엔진닷컴]
[ⓒ DB엔진닷컴]

[디지털데일리 이안나기자] 기업들 생성형 AI 도입이 본격화되면서 데이터베이스(DB) 시장에 변화가 일어나고 있다. 챗GPT와 같은 AI가 때때로 실제 존재하지 않는 잘못된 정보를 만들어내는 ‘환각’ 문제를 해결하기 위해 검색증강생성(RAG)이 필수 기술로 떠오르면서, 이를 지원하는 벡터DB를 둘러싼 시장 재편이 가속화되고 있다.

11일 업계에 따르면 DB시장 판도에 변화가 생기고 있다. 올해 2월 기준 DB엔진닷컴에 따르면 오라클이 여전히 부동의 1위를 차지하고 있는 가운데, 포스트그레SQL과 스노우플레이크, 데이터브릭스 등이 꾸준히 인기도를 높이고 있다. 반면 오라클 다음 인기 순위에 올랐던 MySQL과 마이크로소프트SQL 인기도는 완만하지만 지속적인 하락세를 보인다. 벡터DB 수요가 늘며 이를 지원하는 DB기업들이 빠르게 성장한 영향으로 풀이된다.

벡터DB는 텍스트·이미지 등 데이터를 AI가 이해하기 쉬운 숫자 형태(벡터)로 변환해 저장하는 데이터베이스다. 오라클 관계자는 “기업 업무 프로세스에서 신뢰성 있는 대규모언어모델(LLM) 활용을 위해선 환각을 줄일 수 있어야 하고, 그 방안으로 반드시 필요한 것이 RAG”라며 “벡터 DB는 RAG 프로세스에서 기업이 보유한 지식 또는 문서를 벡터 타입으로 변환해 특정 질문과 관련된 가장 유사도가 높은 지식 또는 문서를 맥락적으로 검색해준다”고 설명했다.

이런 가운데 주요 상용 DB 기업들은 검증된 DB 안정성과 성능을 기반으로 벡터 처리 기능을 추가하는 전략을 구사하고 있다. 국내 DB 시장 70~80%를 장악하고 있는 오라클은 자사 DB에 벡터 처리 기능을 추가한 ‘오라클 DB 23ai’를 선보이며 시장 수성에 나섰다. 벡터 검색뿐 아니라 동일한 DB 내에서 그래프 DB와 데이터를 저장하고 교환하는 데 사용되는 표준 형식인 JSON 데이터 처리까지 지원한다는 점을 차별화 포인트로 내세우고 있다.

RAG 개요 [ⓒ 오라클]
RAG 개요 [ⓒ 오라클]

IBM도 생성형 AI 시대에 맞춰 DB 전략을 재편했다. 최석재 IBM 데이터·AI사업부 기술영업총괄(상무)은 “생성형 AI를 통해 에이전틱 AI 분야가 급부상하고 있고, DB에서도 이를 적용하려는 움직임이 생기고 있다”며 “자연어 질의를 SQL(데이터베이스 검색 언어)로 변환해주는 기술과 오토 튜닝을 통한 DB 및 SQL 최적화 부분으로 현재 대응하고 있다”고 전했다.

티맥스티베로는 실시간 데이터 처리와 고가용성이 요구되는 현대 애플리케이션에 최적화된 ‘뉴SQL(NewSQL)’ DB로 시장에 대응하고 있다. 티맥스티베로 관계자는 “향후 DB 기술은 벡터 DB, 분산 처리 기술, 실시간 분석 등 폭넓은 혁신을 통해 더욱 정교하고 효율적인 방향으로 진화할 것”이라며 “이렇게 고도화된 DB 기술은 기업 디지털전환과 데이터 기반 의사결정을 지원하는 핵심 인프라로 자리 잡아갈 것”이라고 전망했다.

한편 벡터DB 시장에선 오픈소스 진영 성장도 주목받고 있다. 포스트그레SQL을 비롯한 밀버스, 위비에이트 등 오픈소스 기반 벡터 DB들은 개발자 친화적인 환경과 높은 확장성을 무기로 시장 진입을 확대하고 있다. 한편 스노우플레이크와 같은 클라우드 기반 데이터 플랫폼도 벡터 기능을 도입하며 시장에 참여하고 있다.

업계는 RAG 구축 사례가 늘어나면서 벡터 DB 성능과 안정성이 주요 과제로 떠오를 것으로 보고 있다. 오라클 관계자는 “현재 많은 고객사에서 RAG 구축이 이뤄지고 있다”며 “향후 RAG 서비스가 속속 오픈되고 활용이 많아지면 벡터 데이터 규모가 커지면서 필연적으로 성능 이슈가 발생할 수 있다”고 지적했다.

이에 따라 기존 상용 DB 기업들은 검증된 DB 성능을 기반으로 벡터 처리까지 지원하는 전략으로 시장 공략에 나섰다. 전문 벡터 DB 기업들은 벡터 처리에 특화된 기술력을 무기로 맞서고 있어 향후 시장 주도권 경쟁이 더욱 치열해질 전망이다.

오라클 관계자는 “2025년에는 벡터 DB 기능 심화와 대규모 데이터 처리에 따른 성능과 안정성 향상이 주요 이슈가 될 것”이라며 “생성형 AI를 위해 LLM을 미세조정하기 위한 학습 데이터, RAG를 구축하기 위한 벡터 데이터까지 함께 관리하기 위한 AI 및 데이터 플랫폼 중요성이 부각되고 있다”고 설명했다.

디지털데일리 네이버 메인추가
x