- 자체 개발 한국어 운율 적용…일상적 음성 표현 가능
[디지털데일리 이대호기자] 다음카카오(www.daumkakao.com 공동대표 최세훈, 이석우)는 음성 합성 오픈 API(애플리케이션 프로그래밍 인터페이스) ‘뉴톤 톡(Newtone Talk)’의 낭독체 음성을 개선하고 대화체를 추가 제공한다고 17일 밝혔다.
뉴톤 톡은 다음카카오가 지난 6월, 기본 낭독체를 탑재해 첫 선을 보인 음성 합성 엔진으로 입력된 문장을 음성으로 변환해준다. 자체 개발한 한국어 운율 모델을 이용해서 사람의 발성을 재현하고, 대용량·자동화 처리 기술에 의해 다양한 한국어 문장을 빠르게 학습하고 운율을 예측하기 때문에 효율적이라는 게 회사 측 설명이다.
다음카카오는 뉴톤 톡의 새로운 낭독체가 사람이 읽어주듯 자연스러운 음성이 특징이라고 밝혔다. 밝고 부드러운 음색의 성우가 기존 낭독체보다 2배 이상 많은 문장을 녹음한 데이터를 이용했기 때문에 어떠한 문장 조합에도 유연하게 대응할 수 있으며 음질 향상을 위해 합성 방법을 목소리의 여러 주파수 별 파형을 조합하는 방식으로 바꿔서 딱딱한 기계음이 만들어질 가능성을 최소화했다고 강조했다.
예를 들어 ‘안녕’이라는 단어가 문장 앞 부분에 있을 경우 끝 음을 올리고, 문장 중간에 포함될 경우 앞뒤 단어와의 연결에 따라 끝 음을 내리거나 동일 음조로 처리하는 식이다.
다음카카오 구동욱 음성처리파트장은 “뉴스나 책 구절 등의 장문 낭독을 대신하거나 모바일 메시지를 대화체 음성으로 변환하고, 시각 장애인을 위한 생활형 서비스를 개발하는 등 다양한 영역에서 뉴톤 톡의 기능이 활용될 수 있다”며 “뉴톤 톡의 지속적인 강화와 사용 확대가 모바일 환경에서 음성 기술 영역 전반의 발전을 이끌게 될 것”이라고 말했다.
뉴톤 톡은 한 번에 최대 30초 분량의 음성을 합성하고, 입력된 글자의 분석부터 음성화까지 0.1초 안에 처리한다. 현재 뉴톤 톡에서는 남녀 화자 각 하나씩의 낭독·대화 음성으로 총 4개의 음색을 사용할 수 있다.
뉴톤 톡 API는 누구나 다음 개발자 네트워크(http://dna.daum.net/affiliate/newtone)에서 제휴 신청을 하면 발급 받을 수 있으며 일 1만회까지 자유롭게 사용 가능하다.
<이대호 기자>ldhdd@ddaily.co.kr
Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지
[현장]“어르신, 온라인 예약 하셨어요?”...SKT 유심교체 방문해보니
2025-05-10 07:07:00[DD퇴근길] 김영섭號 KT, 통신 다음은 AI…"MS 협력 성과 가시화"
2025-05-09 17:25:15SKT 위약금 면제여부, 6월 말 이후 결론 전망 …"2차 조사결과 먼저 나와야"(종합)
2025-05-09 16:55:50넷플릭스, ‘베이식·광고스탠다드’ 요금인상…“스탠다드·프리미엄은 유지”
2025-05-09 14:37:46[일문일답] 과기정통부 “SKT 침해사고 2차 조사결과, 6월말 발표”
2025-05-09 13:36:41KT 통신 성장 견조, AI·부동산이 견인…AX 매출 가시화 시동(종합)
2025-05-09 12:15:13국내 플랫폼 다 죽는다…"공정거래법 개정안, 경쟁력 약화할 것"
2025-05-09 19:09:38[DD퇴근길] 김영섭號 KT, 통신 다음은 AI…"MS 협력 성과 가시화"
2025-05-09 17:25:15[현장] "한계란 없는 날"…배민 팝업, 기억에 남을 한입은?
2025-05-09 16:17:30'월드투어'로 본 '베이비몬스터' 화력…YG 흑자전환 이끌었다
2025-05-09 16:16:19"AI가 코디 추천"…넥슨 메이플스토리, 'AI 스타일 파인더' 출시
2025-05-09 15:03:18