실시간
뉴스

AI

AI 성패, 모델 아닌 ‘데이터 품질’에 달렸다… ‘AI 레디’가 기업 핵심 화두

[AI 웨이브] 레거시 데이터 ‘AI 자산화’ 필수… 정형·비정형 통합 관리 기술 부상

[사진=AI로 생성한 이미지]

[디지털데일리 이안나기자] 생성형 AI 투자 열풍이 2년차에 접어들면서 정작 기업 AI 성패를 가르는 것은 모델 성능이 아니라 데이터 품질이라는 인식이 확산되고 있다. 학습과 추론에 즉시 활용 가능한 형태로 데이터를 정비하는 ‘AI 레디 데이터’ 개념이 기업 IT 핵심 화두로 부상한 배경이다.

가트너는 2026년까지 AI 레디 데이터 기반이 없는 AI 프로젝트의 60%가 폐기될 것으로 전망했다. F5 네트웍스가 전 세계 IT 의사결정권자 650명을 대상으로 실시한 조사에서도 비슷한 흐름이 확인된다.

‘AI 도입의 주요 장벽’으로 데이터 품질 미성숙을 꼽은 응답자가 2024년 56%에서 2025년 48%로 소폭 줄었지만 여전히 2위를 차지했고, ‘확장 가능한 데이터 관행을 갖추지 못했다’는 응답도 33%에서 34%로 비슷한 수준을 유지했다. 데이터 관련 장벽이 복수 항목에 걸쳐 상위권에 포진한 셈이다.

문제의 본질은 ‘데이터 부재’가 아니라 ‘AI가 쓸 수 있는 데이터의 부재’다. 기업들이 수십 년에 걸쳐 구축해온 레거시 시스템과 사일로화된 데이터베이스, 거버넌스 없이 쌓인 비정형 데이터는 AI 모델이 정확히 찾고 이해하기 어렵다. 검색증강생성(RAG) 구현이나 파인튜닝이 기대만큼 작동하지 않는 1차 원인도 여기에 있다.

국내 데이터 전문기업 엔코아는 ‘AI 레디 데이터’를 핵심 사업 전략으로 삼고 관련 솔루션과 교육 사업을 확장하고 있다. 엔코아는 통합 메타데이터 플랫폼 ‘유니파이드 메타’를 AI 레디 데이터 플랫폼 출발점으로 제시한다. 정형·비정형 데이터를 하나의 데이터 맥락 지도로 통합해 AI 에이전트가 가장 빠르고 정확한 경로로 데이터에 접근하도록 지원한다는 구상이다.

엔코아는 “많은 기업이 개념검증(PoC) 이후 전사 확산 단계에서 유의미한 결과를 도출하지 못하는 이유는 AI 기술이나 인프라 문제라기보다 데이터 준비도(Data Readiness)에 있다”고 진단한다. 엔코아는 최근 업스테이지와 ‘AI 레디 데이터 플랫폼’ 기반 공동 사업에 나섰으며 고용노동부 K-디지털트레이닝(KDT) AI 캠퍼스 운영기관으로도 선정돼 관련 인력 양성에도 본격 뛰어들었다.

글로벌 진영에서는 오라클이 ‘오라클 AI 데이터 플랫폼’을 앞세워 시장 공략에 나섰다 지난해 10월 오라클 AI 월드에서 정식 출시된 이 플랫폼은 오라클 클라우드 인프라스트럭처(OCI), 자율운영 AI 데이터베이스, OCI 생성형 AI 서비스를 결합한 통합 솔루션이다. 정형·비정형, 일괄·실시간 등 모든 유형 데이터를 단일 플랫폼으로 묶고, 수집부터 벡터 인덱싱까지 자동화해 원시 데이터를 AI가 바로 쓸 수 있는 상태로 만든다.

데이터 이동을 최소화하는 제로-ETL·제로 카피 기능을 갖췄고 델타 레이크·아이스버그 등 오픈 포맷도 지원한다. 액센추어, KPMG, PwC 등 글로벌 SI·컨설팅 기업들이 오라클 AI 데이터플랫폼에 총 15억달러(약 2조1000억원) 이상 투자하기로 약속했다. AI 레디 데이터가 단순 솔루션을 넘어 새로운 인프라 카테고리로 자리잡고 있다는 신호로 읽힌다.

데이터를 AI에 연결하는 방식을 두고도 새로운 접근법이 등장하고 있다. AI 레디 데이터 구축의 선결 과제 중 하나는 기업 내 곳곳에 흩어진 데이터 사일로 해소다. 기존 ETL 방식으로 이를 해결하려면 막대한 비용과 시간이 든다는 게 현장의 공통된 지적이다.

디노도코리아는 데이터를 물리적으로 한곳에 옮기는 대신 데이터 가상화 기술로 논리적으로 연결하는 ‘데이터 패브릭’ 방식으로 이 문제에 접근한다.

분산된 데이터 소스를 복제 없이 실시간으로 통합해 AI가 필요한 데이터에 즉각 접근할 수 있는 환경을 만드는 방식이다. 데이터를 이동시키지 않아 보안·거버넌스 관리도 단일 지점에서 처리할 수 있다는 점도 기업 입장에서는 실질적인 장점으로 꼽힌다.

기업 AI 도입의핵심이 모델에서 데이터로 무게중심이 이동하는 흐름은 당분간 이어질 전망이다. 수십년간 쌓아온 레거시 데이터 자산을 AI가 쓸 수 있는 형태로 얼마나 빠르게 정비하느냐가 향후 기업 간 AI 격차를 결정짓는 변수가 될 것으로 보인다.

한편 <디지털데일리>는 오는 5월 14일 소공동 롯데호텔 서울에서 ‘AI WAVE 2026’ 세미나를 개최한다. 생성형 AI 도입이 본격화되는 가운데 기업 AI 전환(AX) 전략과 실제 적용 사례를 집중 조명하는 자리다.

오전 통합세션에서는 김경만 과학기술정보통신부 인공지능정책실장이 2026 정부 AI 기술 육성 및 투자 방향을 발표하며 문을 연다. 이어 우수연 한국IBM 전문위원이 AI 네이티브 시대 소프트웨어 개발 방식의 변화를, 강준범 HS효성인포메이션시스템 DX아키텍트팀 PM이 피지컬AI 인프라 전략을 소개한다. 김태홍 디노도코리아 지사장의 AI를 위한 데이터 전략 발표와 신용희 엠키스코어 상무의 소규모 DLC 데이터센터 전환 전략, 지용구 더존비즈온 대표이사 AX 시대 업무 방식 변화 발표가 이어진다.

오후에는 A·B 트랙으로 나뉜다. A트랙에서는 김민지 한국오라클 클라우드 스페셜리스트 엔지니어가 오라클AI 데이터플랫폼을, 김성식 엔코아 그룹장이 AI 레디 데이터 전략을, 유인지 코리아엑스퍼트 대표이사가 자율형 AI 에이전트 기반 금융 패러다임 변화를 다룬다. 강병준 LG AI연구원 테크 리드는 에이전틱 AI와 자율 제조의 미래를 발표한다. B트랙에서는 박정환 라온시큐어 PM, 김종민 LG CNS 팀장, 박승호 이노에이엑스 이사, 정철호 퀄컴 테크날러지스 코리아 전무가 보안·엔터프라이즈 AX 혁신 전략을 소개한다.

오후 통합세션에서는 윤호성 아카마이 코리아 이사의 GEO 전략, 김영석 에버퓨어 코리아 상무의 엔터프라이즈 데이터 클라우드 기반 에이전틱 AI, 권기석 영림원소프트랩 사업부장의 ERP와 AI 융합 전략, 조익환 SKT 본부장의 피지컬 AI 기반 제조 혁신, 김정희 다울티에스 이사의 다올 퓨전 발표가 예정돼 있다.

사전 온라인 등록은 <디지털데일리> 홈페이지를 통해 가능하다.

디지털데일리 네이버 메인추가