야놀자도 뛰어든 ‘AI’, 여행객 위한 다국어 LLM 개발 시동

실시간
뉴스

야놀자도 뛰어든 ‘AI’, 여행객 위한 다국어 LLM 개발 시동

디지털데일리 발행일 2024-03-20 10:35:54

이나연 기자

URL복사

[디지털데일리 이나연기자] 여가·여행 플랫폼 야놀자가 지난 1월 공개한 거대언어모델(LLM)이 세계 최대 머신러닝 플랫폼이자 오픈소스 커뮤니티인 허깅페이스 리더보드에서 긍정적인 평가를 받고 있다. 야놀자는 AI 서비스의 근간이 되는 LLM 개발을 통해 각 언어에 최적화된 모델을 구축하고, 전 세계 여행객들의 여가 가치를 높인다는 목표다.

20일 허깅페이스 리더보드에 따르면, 야놀자의 ‘EEVE-코리안’ 모델은 EEVE-코리안은 ‘SentiNeg(문장의 긍·부정과 미묘한 감정 차이를 인식하는 지표) 테스트’에서 95% 이상의 정확도를 보였다. 해당 모델 적용 전과 비교하면 약 40%포인트 증가한 수치로, 미묘한 뉘앙스 차이까지 이해하는 능력을 갖추며 한국어 능력이 큰 폭으로 향상됐다는 분석이다.

효율성 측면에서도 우수한 결과를 얻었다. 기존 학습 방법으로 수조 개의 학습 토큰이 필요했다면, 이번 연구를 통해 단 20억개의 토큰만으로도 비영어권 언어 능력을 크게 높일 수 있음을 입증했다는 설명이다.

야놀자 측은 “토큰의 효율성을 높여 학습 속도를 2배 이상 높이고 비용 또한 대폭 절감할 수 있는 것으로 나타났다”라고 부연했다.

앞서 야놀자는 직접 연구한 EEVE(효율적이고 효과적인 단어 확장 방식, Efficient and Effective Vocabulary Expansion)를 LLM에 적용해 EEVE-코리안을 개발했다. 영어 기반의 LLM에 한국어를 효과적으로 학습시켜 기존에 어렵다고 여겨졌던 영어 수준은 유지하면서도 한국어 처리 능력을 높인 것이 특징이다.

또한 EEVE-코리안 모델은 챗봇 아레나의 이달 순위 기준 현재 5위를 차지하고 있다.

챗봇 아레나는 캘리포니아대학교의 버클리 캠퍼스와 샌디에이고 캠퍼스, 카네기멜론대학교가 공동으로 설립한 LMSYS 조직이 만든 LLM 벤치마크 플랫폼이다. 인간 사용자를 오픈 채팅에 초대해 AI 모델 2가지와 대화를 나눈 후 투표를 통해 순위를 매기는 방식으로 진행된다.

오픈AI와 구글 등 글로벌 빅테크 기업의 모델이 상위권을 장악한 가운데 이뤄낸 성과라고 회사 측은 강조했다. 향후엔 한국어를 시작으로 일본어, 중국어 등 전 세계 다양한 언어를 효과적으로 지원하는 다국어 LLM을 개발하기 위해 지속 노력할 방침이다.

야놀자 측은 “여가 산업 특성상 국가별 다양한 언어의 데이터를 처리하는 능력이 필수인 만큼, 고도화한 LLM을 여행 시장에 접목해 고객이 보다 쉽고 편하게 여행을 준비할 수 있도록 지원할 것”이라고 전했다.