[디지털데일리 김문기 기자] “안전한 데이터 처리 환경을 조성하기 위해서는 가명 또는 익명 처리가 반드시 전제돼야 한다.”
22일 <디지털데일리>가 서울 양재동 엘타워에서 개최한 ‘클라우드 임팩트 2023 컨퍼런스’에 이규성 이지서티 전무는 ‘AI・클라우드 환경에서 데이터 가명・익명・결합처리 방안’을 주제로한 발표에서 이같이 말했다.
정부는 개인정보보호를 준수하면서도 데이터 활용 시장을 확산시키기 위해 개인정보보호법과 정보통신망법, 신용정보법 등 데이터 3법에 맞춰 정책을 실행하고 있다.
이규성 전무는 “예전에는 개인정보 이용 수집 동의를 받아야 했으며 가명 처리를 한 데이터라고 하더라도 같은 동의를 받아야 했다”라며, “데이터3법이 통과되면서 어떤 특정 조건에 부합하면 가명처리된 데이터를 바로 활용할 수 있는 길이 열렸다”고 말했다.
아울러 단체나 기업이 공공기관을 상대로 데이터를 공개해달라는 요청을 할 수 있는 ‘정보공개법’, 데이터를 가명 처리해 모아놓고 산업간 교류나 융합 등을 통한 서비스 개발과 정책적 제언을 할 수 있는 ‘데이터산업법’도 포함된다.
이 전무는 “개인정보 그대로를 공개할 수 없기 때문에 가명처리해 데이터 안정성을 확보해야만 하며, 산업간 교류 또는 융합 등을 위해서라도 가명 및 익명 처리는 절대적인 조건이다”라고 설명했다.
즉, 데이터 3법과 정보공개법, 데이터산업법 모두 개인정보보호를 위한 가명과 익명 처리를 전제로 하며, 이러한 흐름은 개인정보에 대한 익명/가명 솔루션 시장의 확대를 의미한다는 설명이다. 이 시장에 대응한다면 또 다른 가치를 부여할 수 있다는 것.
그는 “가명 처리의 필요성은 안전한 데이터 처리 환경을 조성하기 위해서이며, 사용 목적에 맞도록 데이터의 효용성을 유지하면서 개인의 재식별 위험을 제거해 최적의 가명 처리 방안을 확립하는게 무엇보다 중요하다”라며, “내부 결홥과 외부 결합 등 데이터 결합을 통해 기존 정보를 벗어난 새로운 정보 창출로 인사이트를 얻기 위해서라도 처리 능력을 향상시켜야 한다”고 당부했다.
다만 실제 가명 및 익명처리에는 인공지능(AI) 등의 도움을 받아야 한다. 외부적으로는 데이터가 쓰이는 환경에 따라 각 요소의 민감도가 달라지고, 내부적으로는 학습 데이터로 전환시켜 활용 가능한 정형 데이터로 바꿔줘야 하기 때문이다.
이 전무는 “각 분야마다 민감정보 여부가 다르기 때문에 개인정보 여부를 판단해 사전 준비 작업을 실시 후 그 데이터를 가지고 약 40여가지 처리방식에 의거해 가명처리를 시작하게 된다”라며, “이같은 가명 데이터는 적정성 평가를 거치게 되며 부적합 판정을 받으면 다시 가명 처리를 하게 되고 적합하다고 한다면 그에 따른 데이터 활용이 가능하게 된다”고 설명했다. 사후에도 데이터를 물리적 기술적인 보호를 받아야 하며, 추후 파기 절차를 밟게 된다.
하지만 이 민감정보 여부를 식별하는 것부터 어려움이 따른다. 가명처리기법 추전 전부터 추천, 그리고 그에 따른 처리까지 무수한 분석을 필요로 한다. 이 때 머신러닝과 같은 학습모델을 생성해서 항목별로 추천 가명 데이터를 추출하는 방식으로 나아가야 한다.
이같은 어려움을 극복한 이지서티는 ‘아이덴티티 쉴드’를 통해 가명정보결합전문기관 1위에 올랐다. 현재 가장 많은 레퍼런스를 쌓아놓고 있다. 현재 KT와 AWS, NHN 등에 솔루션을 납품했다. 결합전문기관의 경우 국내 20%, 데이터 전문기관은 무려 50%가 이지서티를 선택했다.
그는 “국내 유일의 우수조달 제품으로 조달청 혁신 제품으로 등재돼 있다. 클라우드 성능 평가 품질 등 다양한 플랫폼 환경에서 탁월한 품질을 바탕으로 구축해놓은 상태다”라고 자신했다.