[디지털데일리 이나연 기자] 메타가 4000개 이상 음성 언어를 식별하고, 약 1100개 언어를 음성에서 텍스트, 또는 텍스트에서 음성으로 변환해 주는 ‘대규모 다국어 음성인식(Massively Multilingual Speech, 이하 MMS)’ 인공지능(AI) 모델을 오픈소스로 공개했다.
메타는 이번에 공개하는 AI 모델이 음성-텍스트 변환 및 텍스트-음성 변환이 가능한 언어 수를 기존 100여개에서 1107개로 10배가량 확대했다고 24일 밝혔다. 음성으로 식별 가능한 언어 수 역시 4000개 이상으로 40배가량 늘렸다.
지원 언어 수 증가뿐만 아니라, MMS 프로젝트를 통해 훈련된 AI 모델은 기존 음성 변환 모델보다 성능이 향상했다. 메타 분석 결과, 음성 변환 언어 수를 61개에서 1107개로 18배가량 늘렸을 때 문자 오류율은 0.4% 증가했다.
또한 오픈AI 음성인식 모델 ‘위스퍼’와 유사 비교를 수행한 결과, MMS 데이터로 교육된 모델은 단어 오류율을 절반으로 줄이면서도 11배 더 많은 언어를 처리할 수 있는 것으로 나타났다.
메타는 언어 다양성 보존에 기여하고, AI 생태계 전반 발전과 책임 있는 개발을 위해 MMS 모델과 코드를 오픈소스로 공개한다. 수천개 언어를 지원하는 단일 음성 모델 구축을 위해 적용 언어 범위를 늘리고, 기존 음성 기술로는 다루기 어려운 방언 처리 문제 해결을 위해서도 노력할 계획이다.
Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지
KT, 국내 제조업 겨냥 AX사업 드라이브…“AI 전환 전방위 지원”
2025-05-22 15:52:19과기정통부, SKT 침해사고 계기 정보보호 투자 확대방안 논의
2025-05-22 14:00:00SKT, 유심교체 3일간 100만명…"고객 유심교체 집중"
2025-05-22 11:29:55KT, 전국 공중전화부스 개조해 ‘스마트 안전 쉼터’ 만든다
2025-05-22 09:35:16"콜 몰아주기 아냐"…카카오T 블루 과징금 271억원, 법원서 뒤집혔다
2025-05-22 15:55:23수도권 최대 게임쇼 '플레이엑스포' 개막…글로벌 기대작이 한가득
2025-05-22 15:44:20시프트업 '스텔라 블레이드', 내달 12일 '니케' 컬래버 DLC 출시
2025-05-22 15:10:44무신사, 1분기 순이익 2배↑…비상경영 속 선택과 집중 통했다
2025-05-22 15:10:02네오위즈, 'P의 거짓' DLC 게임 플레이 영상 공개
2025-05-22 13:27:40