실시간
뉴스

뉴스

[PLAY IT] 5개 국어 더빙 콘텐츠도 하루면 '거뜬'…AI가 만든 혁신

KT AI 보이스 스튜디오.

[디지털데일리 강소현 기자] KT가 최근 자사 음성합성 콘텐츠 제작 플랫폼 ‘KT AI 보이스 스튜디오’를 통해 ‘마이AI보이스’ 서비스를 선보였다.

KT ‘마이AI보이스’는 내 목소리와 닮은 AI 목소리를 생성해주는 서비스다. 별다른 기술이 없는 일반인도 접근하기 쉬운 서비스를 표방하고 있는 가운데, 기자도 '마이AI보이스'를 활용해 나만의 AI 보이스를 만들어봤다.

AI 목소리를 생성하기 위한 첫 순서는 KT AI 보이스 스튜디오 가입이다. 가입절차는 간단하다. 홈페이지에 접속해 이메일과 이름, 생년월일 등 일련의 정보들을 입력하면 된다.

KT는 2022년 7월 AI 스타트업 휴멜로와 함께 AI 음성합성 콘텐츠를 제작할 수 있는 ‘AI 보이스 스튜디오’ 플랫폼을 출시했다.

‘AI 보이스 스튜디오’는 크게 2가지 서비스로 구성됐다. 기본으로 제공되는 AI 목소리에 즐거움·침착함·중립·슬픔·화남 등 5가지 감정을 합성할 수 있는 ‘AI 보이스’와, 이 AI 보이스를 활용해 영상 등 오디오 합성 콘텐츠를 제작할 수 있는 ‘스튜디오’다. 최근엔 여기에 내 목소리와 닮은 AI 목소리를 생성해주는 서비스 ‘마이AI보이스’를 추가했다.

'마이AI보이스' 서비스를 이용하려면 내 목소리를 먼저 등록해야 했다. 주어진 문장을 녹음하면, 이를 토대로 나만의 AI 목소리를 만들어주는 방식이다.

먼저, 녹음할 스크립트를 선택했다. 제주도·경상도·강원도·충청도·전라도 방언이나 일상대화, 뉴스기사 등이 있으며 각 스크립트는 총 30문장으로 구성됐다. 녹음을 완료하기 까진 대략 3분이 소요됐다.

녹음을 완료하고 나면 화자 이름과 함께 언어, 성별, 톤 등을 설정할 수 있고, AI는 입력한 정보를 토대로 녹음본을 학습한다. 학습하는 데는 대략 하루가 소요되며, 대시보드를 통해 진행 현황 확인이 가능했다.

KT AI 보이스 스튜디오.

이렇게 제작된 자신만의 AI 음성을 활용해 오디오북이나 유튜브 영상 등 다양한 오디오 콘텐츠 제작도 가능하다. 예컨대 KT는 지난해 9월 레바논으로 파병된 동명부대 27진 장병 가족들을 위해 파병 전 제작한 장병들의 AI목소리로 자녀들에게 동화책을 읽어주는 서비스를 제공한 바 있다.

오디오 콘텐츠 제작과정은 간단하다. 기자는 기사 본문을 한문장씩 옮긴 뒤 앞서 제작한 마이AI보이스를 입혔다. 마이AI보이스 외에도 기본으로 제공되는 AI보이스를 활용해 오디오 콘텐츠를 제작할 수도 있다. 유명인들의 음성을 AI로 제공하는 ‘셀럽 AI 보이스’ 기능도 제공 중이다.

개인적으론 보이스의 발화 속도와 높낮이를 조정할 수 있을 뿐 아니라, 감정과 언어 합성이 가능한 점이 흥미로웠다. 한국어·일어·중국어·영어·스페인어 등 5개국어 합성이 가능해 글로벌 시청자를 겨냥하고 있는 크리에이터들에게 특히 유용할 것 같았다.

KT AI 보이스 스튜디오.

총평하자면, 마이AI보이스는 실제 목소리와 놀라울 정도로 흡사했다. 주변인들과 마이AI보이스를 공유한 결과 이질감이 다소 느껴졌지만, 누구의 목소리인지 구분하는데에는 어려움이 없었다.

다만 호흡이나 말투 습관 등 개인적 특징들을 담아내는 데에는 한계가 있었다. 이용자가 스크립트를 얼마나 자연스럽게 읽어 내느냐에 따라 그 편차는 클 것으로 보인다. KT는 다양한 감정 표현/연기가 가능하게 끔 스크립트를 지속 추가하겠다는 계획이다.

오디오 콘텐츠 제작을 위한 기능이 한정된 점도 아쉬웠다. 일반인의 진입장벽을 낮추는 것을 목표로 하고 있는 만큼, 콘텐츠별 제작 가이드라인이 있다면 보다 쉽게 즐길 수 있을 것으로 기대됐다.

향후 KT는 AI 보이스 스튜디오를 동영상 콘텐츠 제작까지 가능한 AI 디지털 콘텐츠 제작 플랫폼으로 진화시킬 예정이다. 또 이용자가 AI 보이스를 다양한 서비스에서 활용할 수 있도록 지원할 방침이다. 앞으로 ‘기가지니 내 목소리 동화 서비스’와 날씨안내 및 문자, 알람 서비스 등에도 마이AI보이스 적용을 확대한다.

디지털데일리 네이버 메인추가
x