[법무법인 민후 현수진 변호사] 음성명령을 알아듣고 검색, 음악 재생, 배달 주문 등을 실행하는 인공지능 스피커는 이미 상당히 보편화 된 상품이다. 사실 AI 스피커가 처음 등장했을 때만 하더라도, 단순한 명령조차 제대로 인식되지 못해 효용성이 낮았다. 그러나 몇 년 사이 음성인식 기술이 비약적으로 발전하면서, 최근 출시된 상품들의 경우 거의 사람과 유사한 수준의 대화 의도 파악률을 갖춘 경우가 많다.
AI 기술의 발전에 있어 가장 중요한 것은 양질, 다량의 학습용 데이터를 확보하는 데 있다. AI 학습용 데이터란 영상, 문서, 음성 등의 원천 데이터와 이를 가공한 라벨링 데이터의 묶음으로 구성된다. 음성인식 기술은 어떻게 이처럼 빠르게 발전할 수 있었을까? AI 스피커 서비스를 제공하는 업체들은 스피커로 확보한 이용자의 목소리를 녹음한 뒤에 이를 문자로 입력해 분석하는 전사 작업을 거쳐 AI 음성인식 기술 개선을 위한 학습용 데이터로 활용하고 있다.
이하에서는 이용자의 목소리를 AI 학습용으로 활용시 개인정보 보호 관련 이슈를 방지하는 방법을 알아보겠다.
적법한 개인정보 수집·이용 동의를 구하는 방법에 대하여
음성인식 기술은 ①음성 데이터가 뜻하는 바를 인식해 텍스트 데이터로 전환하는 (협의의) ‘음성인식(STT, Speech to Text)’ 기술과 ②음성 데이터에 포함된 특성을 이용하여 발화자를 식별하는 ‘화자인식’ 기술로 구분된다. AI스피커의 경우, 음성명령을 알아듣는 기본적 기능 수행에는 STT기술만이 필요하지만, 특정인의 목소리에만 반응하는 기능을 탑재한 경우, STT 기술과 화자인식 기술이 모두 적용된다.
개인정보란 그 자체로, 또는 다른 정보와 쉽게 결합하여 특정 개인을 알아볼 수 있는 정보를 의미하는데, 사람의 목소리에는 개인별로 고유의 음성 주파수가 있으므로, 음성정보는 식별가능성이 있는 개인정보에 해당한다.
따라서, AI 스피커에 녹음된 이용자의 목소리를 AI 학습용으로 활용하려면 이용자로부터 명시적 사전 동의를 받아야 한다. 특히, 개인정보보호위원회가 발간한 ‘인공지능(AI) 개인정보보호 자율점검표’에 따르면, AI 학습용 데이터 활용 목적의 개인정보를 수집·이용할 경우, 개인정보 처리의 목적이 'AI 알고리즘 개발을 위한 학습용 데이터 구축'이라는 점을 구체적으로 알려야 하며, '신규 서비스 개발' 등 포괄적인 목적을 포함하는 것으로는 부족하다.
화자인식 기술이 적용된 AI 스피커의 경우, 이용자의 목소리는 특정 개인을 인증 또는 식별하기 위해 기술적으로 처리되는 신체적 특성에 관한 생체정보로서 민감정보 또는 바이오정보에 해당한다.
이 경우, 이용자의 음성정보를 활용하려면 민감정보 또는 바이오정보 처리와 관련하여 별도의 동의를 구하여야 하며, 목소리에 포함된 특성을 추출하여 특징정보를 생성한 뒤에는 음성정보 원본은 원칙적으로 삭제하여야 한다.
비정형데이터의 가명처리 가능성에 대하여
가명처리라 함은, 개인정보의 일부를 삭제하거나 일부 또는 전부를 대체하는 등의 방법으로 추가정보 없이는 특정 개인을 알아볼 수 없도록 처리하는 것을 의미한다. 개인정보 보호법 제28조의2 제1항에 따르면, 가명처리한 개인정보는, 통계작성, 과학적 연구, 공익적 기록보존 등을 위하여 정보주체의 동의 없이 처리할 수 있고, AI 서비스 기능 개선을 위한 기술개발은 과학적 연구의 하나로 인정된다.
그러나 음성 및 영상 형태의 비정형 데이터에 대해서는 안정된 가명처리 평가 기준이 존재하지 않는다는 점에서, 보건복지부와 개인정보보호위원회는 음성정보, 지문 등의 생체인식정보에 대한 가명처리 가능여부에 대한 판단을 유보하면서, 해당 정보는 본인 동의 기반으로만 사용할 수 있다고 판단하였다.
정리하자면, 음성정보를 AI 알고리즘 개선을 위하여 활용하려면 정보주체의 수집·이용 동의를 구해야 한다. AI 스피커 서비스를 제공하는 업체가 내부적 기준에 따라 음성정보를 가명처리한다고 하더라도, 비정형 데이터의 경우 가명처리 평가 기준이 마련되어 있지 않아 비식별화 수준이 개인정보 보호법이 요구하는 기준에 부합하는지를 확인하기 어렵기 때문이다.