[디지털데일리 이종현기자] 음성을 인식하는 인공지능(AI) 기술은 사회 곳곳에서 활용되고 있다. 스마트폰의 AI 비서나 AI 스피커가 대표적이다. 최근에는 음성(Speech)을 문서(Text)로 옮기는 STT(Speech To Text) 기술도 빠르게 발전하고 있는데, 이를 이용한 서비스도 출시되는 중이다.
20일 AI 기반 음성인식 기술 기업 아틀라스랩스가 선보인 ‘센트로이드(Sentroid)’도 STT 기술을 이용한 서비스다.
센트로이드는 대화 데이터를 체계적으로 구조화해 분석 가능한 데이터로 전환하는 기능을 갖췄다. 음성파일들을 문서화하는데 그치지 않고, 여러 파일 속에서 특정 문장이나 단어를 검색할 경우 뉘앙스에 대한 분석을 통해 찾고자 하는 정보를 전달한다.
이와 같은 기술이 활용되는 영역은 컨택센터(Contact Center)다. 전화상담을 하던 콜센터는 최근 이메일, 화상통화, 채팅, 원격제어 등 다양한 채널 및 기능을 갖춘 컨택센터로 변하는 중이다. 고객과 기업을 연결하는 접점 역할을 하는데, 누적되는 고객 상담 데이터는 보다 나은 서비스를 제공하기 위한 재료로 활용되고 있다.
컨택센터의 규모가 커질수록 관리자가 모든 내용을 파악하는 것은 어렵다. 특히 최근에는 컨택센터를 외부 업체에게 맡기는 사례가 늘고 있다. 이에 AI를 이용한 컨택센터, AICC 시장이 빠르게 성장하고 있으며 아틀라스랩스도 센트로이드로 출사표를 던진 성태다.
◆핵심은 음성인식 정확도··· 통화녹음 앱 ‘스위치’가 밑바탕
서비스의 핵심은 높은 음성인식 정확도다. 음성을 문서화하더라도 정작 정확도가 떨어진다면 의미가 없다.
여기서 문제가 생긴다. 방대한 데이터셋이 있기 때문에 오픈소스를 바탕으로 AI를 학습하더라도 우수한 성능을 보일 수 있는 영어나 중국어에 비해, 한국어는 데이터의 양이 부족해 음성인식 정확도가 낮을 수밖에 없다는 점이다. 마이크로소프트(MS) 등 글로벌 빅테크 기업이 언어별 음성인식 기술을 순차적으로 공개한 것도 이 때문이다.
2016년 창업한 아틀라스랩스도 같은 문제를 겪었다. 당초 엔터프라이즈용 음성인식 서비스를 개발하려 했으나 한국어의 경우 필요로 하는 인식률에 도달하지 못하는 문제에 직면했다.
미국 태생인 류로빈 대표는 “미국 스타트업 중 음성을 문서화하고, 이를 분석하는 서비스를 제공하는 공(Gong)이라는 기업이 있다. 영업 사원들의 대화를 전문 매니저가 코칭하는 서비스인데, 한국어를 기반으로 이런 서비스를 제공하고 싶었다. 하지만 서비스를 개발하고 보니 필요로 하는 만큼의 정확도가 나오지 않았고, 지난 몇 년은 이를 해결하는 데 시간을 보냈다”고 말했다.
AI의 음성인식 정확도를 높이기 위해서는 보다 다양한 음성 데이터를 확보해야 한다. 이에 류로빈 대표는 대중이 사용할 수 있는 서비스를 개발키로 했고, 그렇게 탄생한 것이 통화녹음 내용을 문서화하는 애플리케이션(앱) ‘스위치’다.
스위치는 일반적인 방법으로는 녹음이 안 되는 애플의 스마트폰에서도 녹음이 가능하다는 것을 무기로 내세우며 영향력을 키웠다. 20일 기준 애플 앱스토어 생산성 앱 차트 4위로, 1만2000개의 평가를 받은 가운데 4.6점이다. 50만명 이상의 이용자가 사용 중이다.
스위치의 이용률 증가는 곧 AI 학습을 위한 데이터 확보로 이어진다. 당초 75%가량의 일반인 음성인식 정확도는 목표치로 한 85% 이상까지 높아졌다. 류로빈 대표에 따르면 85%는 음성을 듣지 않고 문서만으로 내용을 파악할 수 있는 수치다.
◆‘우선은’ AICC 정조준··· 차후 시장 확대 가능성 무궁무진
고도화된 AI 음성인식 기술을 바탕으로 아틀라스랩스가 우선 겨냥한 것은 AICC다. 한창 성장하는 데다 아틀라스랩스의 기술이 적용되기 안성맞춤인 시장이라는 계산이다.
다만 경쟁사가 만만찮다. 이동통신 3사를 비롯해 네이버클라우드, 카카오엔터프라이즈 등 클라우드 기업에 더해 LG CNS와 같은 시스템통합(SI) 기업들도 AICC 시장에 뛰어들었다. 규모 면에서 훨씬 큰 기업들과 경쟁해야 하는 상황이다.
이에 센트로이드는 음성인식 정확도와 함께 클라우드 기반 서비스, 서비스형 소프트웨어(SaaS)라는 점을 또 하나의 강점으로 내세운다.
류 대표는 “전통적인 컨택센터의 최대 문제점은 온프레미스 기반으로 구축되고 있다는 점이다. 가령 한 고객사가 컨택센터를 운영하며 데이터를 축적해 성능을 높이더라도, 그 혜택을 누리는 것은 그 고객사뿐이다. 다른 기업에게 그 혜택이 공유되지 않는다”며 온프레미스 기반 컨택센터의 한계를 지적했다.
이어서 “하지만 클라우드 기반 컨택센터는 곳곳에서 활용되고 있는 컨택센터를 바탕으로 성능이 점차 고도화되고, 이 혜택을 모두가 누릴 수 있다. 그렇게 높아진 성능은 더 많은 고객을 부르고, 이는 또 더 높은 성능으로 이어지는 선순환 구조가 형성될 수 있다”고 강조했다.
대기업이 아니라는 것에 따른 이점도 있으리라 전망된다. 인프라를 제공하는 기업의 경우 ‘벤더 종속성’이 발목을 잡을 수 있다. 주요 클라우드 기업들이 정보기술(IT) 환경 전반에 대한 갖가지 서비스를 모두 제공하나 일부 영역에서는 클라우드 기업의 인프라만 이용하고 소프트웨어(SW)는 개별 기업의 서비스를 이용한다.
현재 IT 업계에는 복수의 클라우드나 온프레미스 등을 함께 사용하는 하이브리드 클라우드가 주요 트렌드로 자리 잡았다. 락인(Lock-in)을 피해 인프라를 옮기더라도 해당 서비스를 계속해서 이용할 수 있는 유연성을 갖춘 독립소프트웨어공급기업(ISV)이 강점을 발휘할 수 있고, 이는 아틀라스랩스에도 그대로 적용된다.
센트로이드는 현재 제네시스 클라우드(Genesys Cloud)를 통해 제공된다. 향후 채널을 넓혀 AWS나 마이크로소프트(MS) 또는 네이버클라우드와 같은 국내 클라우드 기업을 통해서도 제공될 수 있다는 것이 류 대표의 설명이다.
그는 “다년간의 노력 끝에 만족할 만한 수준의 서비스를 개발했다. 시장 상황도 무르익었다고 판단된다. 센트로이드는 컨택센터에서의 주요 이슈는 무엇인지, 언제 문제가 발생했는지, 얘기하고 있는 이의 나이대는 무엇인지 등 대화 데이터를 바탕으로 한 실시간 통계나 집계를 자동으로 분석하는, 대화를 눈으로 확인할 수 있는 대화분석(CDA, Conversation Data Analytics) 기능을 제공한다”고 피력했다.
또 “궁극적으로 아틀라스랩스가 하고자 하는 것은 대화에서 보다 깊은 인사이트를 얻는 것이다. 우선 타겟한 것은 AICC 시장이지만 나아가 교육이나 코칭 등, 다방면으로 활용될 수 있을 것”이라고 부연했다.