[디지털데일리 강소현 기자] KT는 AI원팀(AI One Team)의 산학연 공동연구를 통해 4종의 AI 기술을 개발했다고 14일 밝혔다.
KT와 AI원팀이 함께 개발한 4종의 기술은 ▲로봇 실내 공간지능 기술 ▲로봇 소셜 인터랙션(Social Interaction) 기술 ▲보이스 클로닝(Voice Cloning) 기술 ▲한국어 E2E 음성인식 트랜스퍼 러닝(Transfer learning) 등이다. 이 기술들은 향후 KT의 AI 사업 및 서비스에 활용된다.
먼저, ‘로봇 실내 공간지능’ 기술은 로봇이 실내 공간의 사물을 식별하고 사물의 위치를 기억하는 기술이다. 로봇은 공간 내에서 특정 사람이나 사물 등 객체의 종류와 위치를 인식해 3D 지도를 생성한다.. AI원팀은 이 알고리즘을 바탕으로 실내 자율주행에 접목하는 2차년도 연구를 지속할 예정이다.
‘로봇 소셜 인터랙션’ 기술은 사용자의 얼굴 및 행동을 인식한 뒤 로봇이 수행할 행동을 추천하는 알고리즘을 구현했다. KT 로봇은 향후 이와 같은 개별 알고리즘을 연결해 로봇의 개인화된 상호작용을 구현할 계획이다.
‘보이스 클로닝’ 기술은 개인화 음성합성을 위한 목소리 복원 알고리즘으로, 개인의 오디오 샘플을 딥러닝으로 학습해 커스텀 보이스를 제공하는 개인화 TTS 서비스의 핵심 기술이다. 연구진은 지난해 비용은 4분의1 수준으로 줄이고, 속도는 10배 가량 향상시키는 CPU 기반 음성합성 알고리즘 개발에 성공한 바 있다. 이번 연구에서는 커스텀 보이스 학습에 필요한 녹음 시간을 기존 30분에서 3분으로 단축했다. KT는 이 기술을 기가지니, AI통화비서, AI 로봇, AI 교육 등에 도입해 ‘커스텀 개인화 TTS 서비스’를 상용화할 예정이다.
‘한국어 End-to-End 음성인식 트랜스퍼 러닝’ 기술은 한국어 음성인식 성능을 높이면서도 학습에 필요한 데이터를 줄였다. 기존 최고 성능을 내는 딥러닝 음성인식 모델 대비 에러율이 13.7% 감소해 세계 최고 수준의 음성인식 성능을 검증한 것이다. 또 모델을 처음부터 다시 학습하는 것이 아닌 기존 모델을 재사용하는 방식으로 소량의 도메인 데이터를 활용한 음성인식 개선이 가능해졌다. KT는 이 기술을 활용해 KT의 AI 서비스를 고도화한다는 계획이다.
KT AI/DX융합사업부문장 송재호 부사장은 “AI 연구 전문성을 갖고 있는 대학과 산업을 이끌고 있는 기업의 산학 연구는 AI 경쟁력을 강화하는 길”이라며 “올해도 AI원팀에서 연구기관, 기업, 스타트업 간의 협력을 통해 시너지를 내고 AI국가 경쟁력을 높이도록 최선을 다하겠다”고 말했다.
Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지
알뜰폰 업계, 갤럭시S25 가입자 사전유치 경쟁 ‘후끈’
2025-01-19 13:16:35[OTT레이더] 김혜수의 팩트 폭행…디즈니+, '트리거'
2025-01-19 10:15:47[알뜰폰경쟁력강화방안]③전광훈도 적자…설비투자 여력있는 사업자는 ‘단 한 곳’
2025-01-18 08:14:00'갤럭시S25 슬림 vs 아이폰17 에어' 두께전쟁 예고
2025-01-17 17:46:11[DD퇴근길] 美 트럼프 취임식, '쿠팡'도 간다…'피지컬: 100', 제작사 바뀐다
2025-01-17 17:33:29'갤럭시S25' 건너 뛰고…'갤S26' 스택형 배터리 탑재 '솔솔'
2025-01-17 16:17:14넥슨, 삼성전자와 ‘카잔’ 3D 게이밍 경험 위한 기술 MOU 체결
2025-01-19 11:09:54[뉴겜] ‘발할라서바이벌’, 한 손으로 쉽고 빠른 액션 쾌감… 전략·성장도 "10분 만에"
2025-01-19 11:09:35“와, 먹어보고 싶네” 영상 하나로 누적 5만팩…‘유튜브 쇼핑’ 무서운 저력
2025-01-19 10:14:53[현장] 스노우메이지 매력에 ‘일시정지’… 강남 달군 던파 팝업
2025-01-17 17:33:0424시간 후 댓글창 폭파…말 많던 다음뉴스 타임톡, 이용자 불편 듣는다
2025-01-17 15:05:38[IT클로즈업] 분기점 맞은 K-게임, 신흥 시장이 해법될까
2025-01-17 15:02:12