-클로바노트, 음성기록 넘어 회의록 관리 서비스로…글로벌 진출 가속화 -우수한 음성인식 품질, 편리한 사용성…출시 2년만에 다운로드 300만건↑ -글로벌 수준 네이버 음성 AI 기술 탑재 -‘AI 요약’ 통해 서비스 발전…일본 넘어 북미‧아시아 시장 진출할 것
[디지털데일리 최민지 기자] 클로바노트는 2020년 출시된 네이버 인공지능(AI) 음성기록 서비스다. 클로바노트 앱에서 음성을 직접 녹음하거나, 녹음 파일을 업로드하면 음성을 화자 목소리가 구분된 텍스트로 자동 변환해서 보여준다. 한국어, 영어, 일본어, 중국어에 대한 음성인식이 가능하며, 한국어와 영어를 동시에 인식하는 다국어 인식 기능도 탑재돼 있다.
클로바노트는 높은 음성인식 정확도와 편리한 사용성으로 사용자들에게 호응을 얻으며 출시 2년여만에 누적 다운로드 수 300만건 이상을 기록하고 있고, 지난해에는 구글플레이 ‘올해를 빛낸 인기 앱’과 ‘올해를 빛낸 일상생활 앱’에 선정되기도 했다.
우수한 음성인식 품질을 자랑하는 클로바노트에는 네이버의 다양한 음성 AI 기술이 녹아있다. 대표적으로 네이버가 자체 개발한 ‘NEST(Neural End-to-end Speech Transcriber)’ 음성인식 엔진은 길고 비정형화된 문장을 인식하는 데 특화됐다. 네이버 초대규모 AI ‘하이퍼클로바’에도 적용된 자기지도학습 딥러닝 기술이 적용돼 뛰어난 음성인식 성능을 갖추고 있다. 또한 참석자별로 음성인식 결과를 분리하는 ‘WISE(Who Is Speaking)’ 엔진이 탑재돼 사용자들은 어떤 발화자가 한 말인지도 한눈에 확인할 수 있다.
이러한 네이버 음성 AI 기술은 글로벌 연구자들로부터 꾸준히 인정받고 있다. 네이버는 올해 세계 최고 권위 음성 AI 학회인 인터스피치와 ICASSP에 15개 정규 논문을 발표했다. 클로바노트를 비롯해 클로바더빙, 클로바 케어콜 등 네이버 음성 기반 AI 서비스에 적용 가능성이 높은 기술 연구 성과가 두드러져, 향후 클로바노트 기술적 완성도는 고도화될 것으로 기대된다. 실제 네이버는 최근 클로바노트 음성인식 및 화자분리 엔진의 최적화와 경량화를 통해 입력 음성의 길이에 따라 데이터 처리량과 응답 속도를 약 2배 향상시키기도 했다.
클로바노트는 편리한 사용성을 제공하기 위한 노력도 지속하고 있다. 음성기록 편집, 북마크, 녹음 중 메모, 노트 공유 등 편리한 녹음 및 기록 관리를 위한 기능을 추가했다. 지난 8월에는 텍스트로 변환된 내용에 대해 AI가 대화 주제별로 구간을 나누고, 핵심을 자동으로 요약해서 제공하는 ‘AI 요약’ 기능이 도입됐다. 한국어 이해를 바탕으로 자연스러운 요약문을 생성할 수 있는 하이퍼클로바 모델이 활용된 결과다. AI 요약 기능을 시작으로, 클로바노트는 음성 녹취 서비스에서 회의록 관리 서비스로 한 단계 더 나아간다는 계획이다.
글로벌 시장 진출도 가속화한다. 올해 5월 클로바노트 일본어 버전이 출시된 이후, 인식 성능에 대한 일본 사용자들 긍정적인 평가 속에 현재까지 누적 다운로드 수 40만건 이상을 기록하고 있다. 네이버는 향후 북미, 아시아 시장에도 클로바노트를 공개할 예정이다.
네이버 측은 “앞으로 클로바노트에 이미지 추가, 텍스트 강조 등 노트 편집 기능을 강화하고, 코멘트 작성, 작업 관리, 공동 편집, 그룹 공유와 같이 협업에 필요한 기능을 더해 업무 회의록 정리에 있어 차별화된 사용자 경험을 제공할 것”이라며 “내년 상반기에는 업무 계정으로 클로바노트를 사용할 수 있는 워크스페이스 기능 등 기업 환경에 특화된 서비스도 선보이겠다”고 말했다.