실시간
뉴스

일반

"힘을 숨겼나?" 수줍었던 네이버 AI, '눈·귀·입' 열린다

[디지털데일리 이건한 기자] 네이버가 자체 개발한 LLM(대형언어모델) 기반 인공지능(AI) 플랫폼 '하이퍼클로바X'를 고성능 멀티모달 AI로 탈바꿈하기 위한 노력에 힘을 싣고 있다. 성낙호 네이버클라우드 하이퍼스케일 AI 총괄은 11일 네이버가 개최한 연례 콘퍼런스 '단24'에서 '지식의 향상, 감각의 확장'이란 두 가지 하이퍼클로바X 진화 방향성을 제시했다.

단24 키노트에서 하이퍼클로바X 전략을 발표 중인 성낙호 네이버 클라우드 하이퍼스케일 AI 총괄. [ⓒ 단24 라이브 갈무리]
단24 키노트에서 하이퍼클로바X 전략을 발표 중인 성낙호 네이버 클라우드 하이퍼스케일 AI 총괄. [ⓒ 단24 라이브 갈무리]

이날 발표 내용을 종합하면 네이버는 현재 ▲그래프레디(GraphReady) ▲유저 인사이트(UserInsight) ▲오토브라우징(AutoBrowsing) 등 지식 데이터 처리 고도화 모델과 ▲하이퍼클로바 비전(Vision) ▲하이퍼클로바 오디오(Audio) 등 자사 AI의 눈과 입이 될 세부 모델 개발에 박차를 가하고 있다. 나아가 '사용자에게 실질적 도움을 주는 AI'로 하이퍼클로바X를 포지셔닝하고 AI 서비스 수익화의 발판으로 삼을 계획이다.

네이버는 AI 언어모델이 그동안 탁월한 맥락 이해 능력에도 정작 '검색'에서는 만족스러운 답변을 보이지 못했던 이유에 주목했다. 성 총괄은 그 이유를 "파편화된 정보 조각을 종합적으로 탐색하는 일, 확보한 데이터에 대한 깊은 이해, 오디오나 이미지 같은 멀티모달 데이터 접근성 등이 부족했다"고 설명했다. 이 가운데 앞서 언급된 그래프레디와 유저 인사이트, 오토 브라우징은 우선 AI의 데이터 탐색 및 이해와 관련된 문제를 보완하는 기술이다.

먼저 그래프레디는 특정 데이터를 구성하는 주요 개념과 각 개념 간의 관계를 구조적으로 표현한 그래프형 데이터베이스다. AI는 다양한 주제를 이 같은 지식 그래프 형태로 요약해 정리해 두었다가 질문이 들어오면 종합적으로 분석해 신뢰도 높은 답변을 생성할 수 있다. 이때 각 데이터 간 상관관계와 개념이 사전에 잘 정의되어 있을수록 AI가 복잡한 질문에도 정확하고 정교한 대답을 제공할 수 있다.

네이버 그래프레디 데모 中 [ⓒ 단24 라이브 갈무리]
네이버 그래프레디 데모 中 [ⓒ 단24 라이브 갈무리]

가령 특정 자동차 모델 A가 가족용 '패밀리카'로 적합한지 여부와 다른 사람은 어떻게 생각하는지 검색한다고 가정하자. 성 총괄이 시연한 영상에서는 하이퍼클로바X가 직접 다양한 온라인 커뮤니티의 글들을 분석해 A 모델이 패밀리카로 적합하단 의견을 취합하고, 추가로 사용자가 묻지 않았지만 A 모델과 함께 자주 언급된 B 모델의 정보도 추가로 비교해 보여주는 모습을 보였다. 이는 검색 중 취합된 다양한 정보 간 상관관계를 AI가 정확히 파악했을 때 가능한 일이다.

유저 인사이트는 AI가 사용자 행동을 분석해 필요한 질문이나 정보를 추론하는 기술이다. 여기서 네이버는 사용자가 궁금해할 만한 질의를 미리 추천해주는 실험을 진행 중이다. 이를 통해 사용자가 굳이 세부적인 사항까지 명확히 질문하지 않아도 AI가 숨은 의도와 수요를 파악해 먼저 제시할 수 있도록 한다. 이로써 사용자가 AI 검색에 익숙하지 않아도 생산성과 편익을 높일 수 있는 기능이다.

오토 브라우징은 사용자 대신 자동으로 정보를 취합하는 AI다. 리서치 업무를 예를 들면 검색과 클릭, 인용, 페이지 스크롤 등 인간의 기존 정보 탐색 과정을 오토 브라우징 AI가 모방해 최종 답변까지 스스로 만들어 낼 수 있다. 병렬화 처리도 가능하므로 사용자는 기존보다 훨씬 빠르게 복수의 정보를 핵심만 빠르게 수집할 수 있다.

[ⓒ 단24 라이브 갈무리]
[ⓒ 단24 라이브 갈무리]

네이버는 여기에 출처 기반의 팩트체크(사실확인) 기능도 연동해 AI가 답변의 출처까지 확인할 수 있도록 개발하고 있다. 또한 단순 정보 검색에서 나아가 프로그래밍 코드를 스스로 작성하고 수행할 수 있는 기능과 오토 브라우징을 연동해 검색만으론 완성할 수 없었던 '엑셀 데이터 분석 및 인사이트 도출' 등 고급 데이터 분석도 가능하게 할 계획이다.

다음으로 하이퍼클로바X 비전과 오디오는 멀티모달 데이터 처리 능력을 바탕으로 확장된 인사이트 도출, 사용자와의 실시간 소통 강화를 돕는다.

성 총괄은 하이퍼클로바X 비전을 '초대규모 시각언어모델'로 정의했다. 입력된 이미지를 단순 처리하는 수준에서 나아가, 특정 웹페이지 내 텍스트와 이미지 정보도 종합 분석할 수 있는 수준이다. 예컨대 광고주가 특정 상품 페이지 주소를 입력하면 상세페이지에 포함된 이미지에서 제품의 특징, 실측 사이즈 등 비정형 데이터를 자동으로 취합해 유익한 인사이트를 제공하거나 광고 카피도 제안해주는 식이다.

하이퍼클로바X 오디오는 고도화된 음성인식과 합성, 대화의 맥락 이해 능력이 특징이다. 성 총괄의 관련 시연에서 해당 AI는 자신의 발화 중에도 사용자가 끼어들면 곧바로 그에 대한 대응을 이어가는 경청 및 주제 이해 능력을 보였다. 또한 답변에 자연스러운 웃음을 가미하거나 사용자의 침묵에서도 그 의도를 파악해 대응해 한층 자연스러운 대화를 끌어가는 모습을 보이기도 했다. 이는 챗GPT에 최근 추가된 고급 언어 기능과 마찬가지로, 사용자와 AI가 음성으로도 자연스럽고 생산적인 소통을 하도록 도울 것으로 기대된다.

이처럼 네이버가 다각적으로 진행 중인 하이퍼클로바X의 지식 및 감각 확장 플랜은 회사의 국내외 AI 경쟁력 확보 측면에서 향후 중요한 요소가 될 전망이다. 네이버는 현재 국내에서 몇 없는 AI 'A to Z' 개발 및 서비스 역량을 지닌 기업으로 꼽힌다. 이는 네이버가 최근 '소버린AI'로 명명된, 자국 문화와 가치관에 최적화된 AI 모델의 중요성을 자신 있게 강조하는 배경이기도 하다.

하이퍼클로바X 비전 예시, 상세 페이지 내 이미지 속 정보도 명확히 인지할 수 있다. [ⓒ 단24 라이브 갈무리]
하이퍼클로바X 비전 예시, 상세 페이지 내 이미지 속 정보도 명확히 인지할 수 있다. [ⓒ 단24 라이브 갈무리]
네이버 하이퍼클로바X 오디오 예시, 사용자와 인간과 유사한 수준의 상호작용을 주고 받으며 대화할 수 있다. [ⓒ 단24 라이브 갈무리]
네이버 하이퍼클로바X 오디오 예시, 사용자와 인간과 유사한 수준의 상호작용을 주고 받으며 대화할 수 있다. [ⓒ 단24 라이브 갈무리]

다만 이런 네이버의 AI 현주소를 상징하는 하이퍼클로바X는 지금까지 경쟁 대상인 챗GPT, 제미나이 등과 비교해 상대적으로 고급 기능 추가에 소극적인 모습을 보여 아쉬움을 샀다. 그러나 이번 발표는 네이버가 여전히 완성도 높은 AI 모델 개발을 위해 다양한 노력을 기울이고 있었다는 사실을 드러낸다. 관건은 이를 하루빨리 정식 출시하고 네이버 안팎의 다양한 서비스에서 활약하는 모습을 증명해 내는 것이다.

성 총괄도 "경험이 결국 더 나은 경험을 만든다"며 "그동안 AI 원천 기술을 기반으로 쌓아 온 네이버의 경험이 더 나은 사용자 서비스 경험으로 이어지도록 AI 연구 및 여러 서비스에 대한 적용 노력을 지속해 나갈 것"이라고 강조했다.

디지털데일리 네이버 메인추가
x