[디지털데일리 이건한 기자] AI 언어 데이터 기업 플리토가 국립국어원이 주관하는 '한국어-외국어 병렬 말뭉치 구축 사업' 수행 기업으로 5년 연속 선정됐다고 19일 밝혔다. 플리토는 이로써 해당 사업 5개년 계획에 전부 참여한 유일한 기업이 됐다. 5년간 누적 수주액은 115억원에 달한다.
병렬 말뭉치(Parallel Corpus)는 2개 이상의 언어로 번역된 문장 쌍이 포함된 언어 데이터베이스다. AI 번역을 위한 자연어처리(NLP)의 핵심 요소 중 하나다. '한국어-외국어 병렬 말뭉치 구축 사업'은 국립국어원이 AI 시장에서 한국 언어문화의 데이터 주권을 지키면서 한국형 AI 기술 개발을 지원하기 위해 추진하고 있다.
플리토는 본 사업의 1차 중장기 5개년 계획에서 총 5500만개에 달하는 어절을 구축했다. 올해 사업은 주 수행 기관인 경희대학교 산학협력단과 협력하는 형태로 진행되며 총 사업 규모 42억원 중 플리토가 20억원 9000만원 규모의 병렬 말뭉치 구축을 맡는다. 사업비의 약 절반을 확보한 셈이다. 이번 사업에서는 ▲베트남어 ▲인도네시아어 ▲태국어 ▲힌디어 ▲크메르어 ▲타갈로그어 ▲러시아어 ▲우즈베크어 ▲영어 등 9개 언어에 대한 900만 어절 규모의 병렬 말뭉치를 구축할 예정이다.
구축된 언어 데이터는 AI 기반 언어 문화 산업 진흥을 위한 정부 주도 기술 개발에 활용된다. 특히 이번 사업에서 아세안-인도 지역과 유라시아 지역의 저자원 언어 데이터로 풍부하게 구축됨에 따라 데이터 불균형이 해소되고, 국가 간 언어문화 교류 활성화에도 기여할 것으로 예상된다. 구축된 언어 데이터는 국립국어원이 운영하는 언어정보나눔터 통합시스템 모두의 말뭉치에서 확인할 수 있다. 언어 정보 처리 분야에 응용하기 위한 연구 및 기술 개발과 저자원 언어 데이터 시장 진출을 모색하는 기업들이 활용할 수 있다.
이정수 플리토 대표는 "플리토의 언어 데이터 구축 경험과 전문성을 인정받아 5년 연속 사업을 수행하게 되어 뜻깊다"며 "정부가 육성하는 언어 데이터 산업에서 차별화된 고품질 언어 데이터를 지속해 공급함으로써 한국형 AI 기술의 글로벌 경쟁력 확충에 기여하겠다"고 말했다.
Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지
[이음5G 현황下] 확산 한계치 도달?...“DX본격화 되면, 수요 급증” 전망도
2025-04-04 19:46:29법원, 방통위의 KBS 신임감사 집행정지 신청 ‘기각’
2025-04-04 19:41:00[윤석열 파면] 헌재 “야당의 방통위원장 탄핵소추, 계엄령 요건 될 수 없어”
2025-04-04 16:47:39SKT 유영상 “돈버는 AI 성과 본격화”…AI 성과 가시화 재차 강조
2025-04-04 10:44:29'尹 운명의 날'…통신3사, 탄핵선고 앞두고 총력 대비
2025-04-04 10:08:18[단독] 유료방송 위기여파 PP로…“콘텐츠 사용료 약 1200억원 감소 전망”
2025-04-03 17:44:35[윤석열 파면] "네이버·다음 프로필, 前 대통령"…페북·인스타 소개글은?
2025-04-04 18:23:30엔시티 위시, 엠넷플러스 '숨바꼭질' 두번째 플레이어로 출격
2025-04-04 17:44:41[DD퇴근길] 윤석열 대통령 파면…ICT·산업계 미칠 영향은?
2025-04-04 17:16:48[윤석열 파면] '탄핵 기념 정식' 인증샷 급증…中 포털서는 실시간 검색어 1위도
2025-04-04 16:49:16우아한형제들, 독일 모기업 DH 자사주 매입·소각…5372억원 지급
2025-04-04 16:48:46우아한형제들, 지난해 매출 4조원 벽 뚫었지만…무료배달 경쟁에 영업익 감소
2025-04-04 15:16:39