[디지털데일리 이나연 기자] 쏘카가 자연어 처리 분야 세계 최고 학회에서 인공지능(AI) 기술 역량을 인정받았다.
쏘카(대표 박재욱)는 회사 AI팀(박경호 팀장, 김현수 매니저, 조충현 매니저, 원해진 매니저)이 자연어 처리 분야 세계 최고 권위를 자랑하는 ‘EMNLP(Empirical Methods in Natural Language Processing) 2023’에서 채택된 논문으로 우수상을 받았다고 8일 밝혔다.
EMNLP은 자연어 처리 분야 최고 국제 학술대회로 꼽힌다. EMNLP에선 AI 번역, 기계 독해, 번역 등 언어 데이터 기반 인공지능 연구를 다룬다. 이달 6~10일 싱가포르에서 개최되는 EMNLP 2023엔 구글 딥마인드, 마이크로소프트 리서치 등 유수 AI 기업이 참여한다.
쏘카 AI팀은 지난 7일 열린 MRL(Multilingual Representation Learning) 워크숍에 참가, 다양한 언어에서 활용할 수 있는 다국어 언어 처리 기술에 대한 연구 성과를 공유했다.
쏘카 AI팀은 ‘소규모 언어 데이터를 활용한 다국어 음성 파운데이션 모델 학습 방법(Adapt and Prune Strategy for Multilingual Speech Foundation Model on Low-resourced Languages)’을 제안, 수십억 개에서 수천억 개 파라미터를 가진 거대모델에서 필요한 파라미터만 추출해 새로운 언어 혹은 도메인에서도 성능을 보장할 수 있는 사례에 대해 소개했다.
쏘카 AI팀이 제안한 방법은 먼저 ‘복권 가설(Lottery Ticket Hypothesis)’이라는 경량화 기법을 이용해 거대 모델에서 타깃으로 삼은 언어에 관련된 파라미터만을 추출한다. 추출된 파라미터엔 타깃 언어와 관련된 문법적, 고차원 언어적 특성이 담겨있어 적은 파라미터만으로도 충분히 여러 문제를 풀 수 있다.
나아가, 제안한 기법은 도메인에 관련된 지식(domain-specific knowledge)을 추가적으로 학습시키기 위해 LoRA(Low-Rank Adaption)을 이용한다. LoRA 기법을 통해 약 2% 만의 파라미터만으로 학습이 가능해 적은 양의 연산 자원에도 기존과 유사한 성능을 달성할 수 있다고 설명했다.
박경호 쏘카 AI 팀장은 “쏘카에서 연구한 음성 언어 파운데이션 모델을 세계 최고 권위를 자랑하는 학회에서 공유할 수 있어 뜻깊었고, 이번 논문이 성과가 자연어 학습 모델 연구에 레퍼런스로 활용되길 기대한다”며 “앞으로도 지속적인 연구를 통해 쏘카 모빌리티 서비스를 효율화하는 한편, 이용자에겐 더 합리적이고 편리한 이동 경험을 제공하는데 적용할 수 있도록 노력하겠다”고 말했다.
Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지
주파수 재할당대가, 정부가 부르는게 값? “산정방식 검토 필요”
2024-11-22 18:23:52유료방송 시장, 역성장 지속…케이블TV 사업자 중 SKB 유일 성장
2024-11-22 13:28:49[디즈니 쇼케이스] 판타스틱4, MCU 합류…미소 짓는 케빈 파이기
2024-11-22 12:56:31LGU+, 기업가치 제고 계획 발표…"AX 컴퍼니 구조 전환 가속화"
2024-11-22 10:18:34LG헬로 송구영 대표이사 재선임…사업 수익성 개선 '총력'
2024-11-21 18:33:01드림어스컴퍼니, 자본준비금 감액해 이익잉여금 500억원 전입
2024-11-22 14:57:25야놀자·인터파크트리플, 12월 ‘놀 유니버스’로 법인 통합
2024-11-22 14:57:10논란의 ‘퐁퐁남’ 공모전 탈락…네이버웹툰 공식 사과 “외부 자문위 마련할 것”
2024-11-22 14:23:57쏘카·네이버 모빌리티 동맹 순항…네이버로 유입된 쏘카 이용자 86%가 ‘신규’
2024-11-22 12:58:15