[디지털데일리 최민지기자] 영어에 약한 엄마‧아빠도 이제 아이에게 유창한 영어 발음으로 동화책을 읽어줄 수 있다. 한 문장만 녹음하면 영어 음성을 만들어주는 영어 개인화 음성합성 기술로 가능한 시나리오로, KT가 6개월 내 해당 서비스 출시를 공언했다.
30일 KT는 서울 종로구 광화문 KT스퀘어에서 기자간담회를 열고 20여개 인공지능(AI) 원천기술을 공개했다.
이날 KT 직원은 인어공주 영어동화책 한 문장을 읽었고, 영어 개인화 음성합성 기술을 통해 KT AI가 1분간 시연자 목소리를 학습했다. 학습 완료 후 재생을 누르자 행사장 곳곳에서 탄성이 터져 나왔다.
실제 녹음된 문장의 경우 어색한 영어 발음이었으나, 학습이 끝난 후에는 마치 원어민처럼 자연스러웠다. 시연자 영어실력이 갑자기 향상된 것이 아니라, 개인화 음성합성 기술이 만들어 낸 결과다. 영어 발음은 변했지만, 목소리는 시연자와 동일했다.
이날 KT 마케팅부문장 이필재 부사장은 부모 음색으로 아이에게 영어 동화책을 읽어주는 서비스를 “6개월 내 선보이겠다”고 확실히 밝혔다.
앞서, KT는 부모 목소리로 아이에게 책을 읽어주는 ‘내 목소리 동화’를 공개한 바 있는데 이를 영어 버전으로 확대한 것이다.
이와 함께 KT는 청소기 등 시끄러운 소음 속에서 남자 시연자와 외국인 여자 시연자가 동시에 각각 한국어와 영어로 문장을 말하고, 해당 음성만을 깨끗하게 분리하는 ‘스피치 세퍼레인션’ 기술도 선보였다.
잡음 속에서도 화자가 말한 단어와 문장을 골라내고, 각각의 목소리를 분리해 인식하는 데 성공했다. 이는 기가지니와 같은 AI 스피커 등 다양한 AI 서비스 엔진에서 활용 가능하다.
또한, KT는 AI에 대화 스타일링 기술을 적용했다. 상황에 따라 기가지니가 말투와 답변 방식을 달리 하는 시연이 펼쳐졌다. 시연자가 “아이폰11 인기 어때?”라고 묻자, 기가지니는 “꾸준히 팔려서 인기모델은 다음 주까지 기다려야 해요”라고 답했다.
“너 말투가 너무 딱딱해”라고 하자 친근한 말투의 새로운 기가지니가 등장했다. 긴장된다고 하자 기가지니는 “까짓 것 쫄지마”라고 하고, “너 말투가 왜 그래”라고 하니 “너가 반말하면 나도 반말해”라며 재미를 더했다.
이러한 AI 기술을 담은 기가지니 시스템은 호텔에도 도입됐다. 노보텔, 하얏트, 안다즈, 메리어트와 같은 글로벌 호텔 체인에서 기가지니를 채택해 국내 호텔에서 만나볼 수 있다. 야놀자 2만 제휴점과도 협업한다. 해외 7개국과도 협력을 진행하는 만큼, 연말 내 해외 적용 사례를 만날 수 있다.
AI 스피커 보안을 강화하기 위해 KT는 전송구간 암호화와 파라미터 위변조 방지를 위한 암호화 조치를 취했다. 접근제한 통제 시스템도 갖췄다.
아울러, KT는 서울시 교통신호체계와 빌딩 에너지 등에 활용되는 기가트윈 기술을 소개했다. 기가트윈은 작은 데이터를 바탕으로 자가학습을 통해 실제와 같은 트윈 모델을 생성해 문제해결을 도출하는 방식이다. 이를 통해 실시간으로 빌딩 내 실내온도를 유지할 수 있는 최적값을 구할 수 있고, 8만여개 빌딩에 적용하면 원전 1기에 해당하는 에너지 절감을 꾀할 수 있다는 설명이다.
이 부사장은 “KT는 AI를 통해 모든 영역에서 삶의 질을 높이고 사회문제 해결에 적극적으로 기여하겠다”며 “통신을 넘어 AI 전문기업으로 재탄생하기 위해 최선의 노력을 다하겠다”고 강조했다.