인공지능으로 혐오 표현 탐지…튜닙, 11가지 자연어처리 API 공개

이나연 2022.08.11 17:18:02

[디지털데일리 이나연 기자] 자연어처리 중심 인공지능(AI) 스타트업 튜닙이 인공지능 기술로 혐오 표현을 판별하는 서비스를 공개했다.

튜닙은 윤리성 판별, 비식별화 등 11가지 응용프로그램 인터페이스(API) 제품을 출시했다고 11일 밝혔다. 튜닙은 카카오브레인 자연어처리 팀 멤버들이 공동 창업한 AI 스타트업이다. 자연어처리, 초대규모(Hyperscale) AI 등 고난도 AI 기술을 자체 개발 중이며, 지난해 11월 펄어비스캐피탈과 DSC인베스트먼트, 네이버 D2SF로부터 30억원 규모 시드 투자를 유치했다.

이번에 튜닙이 공개한 서비스는 자체 개발한 자연어처리(NLP) 엔진 기반 한국어·영어 API 서비스다. 별도의 추가 코딩이나 배경지식 없이도 사용자가 원하는 단어나 문장을 입력하면 AI가 자동으로 인식해 적합한 결과를 제공한다.

튜닙이 공개한 API 중 핵심은 ‘윤리성 판별(Safety Check)’ API다. 사용자가 텍스트를 입력하면 튜닙 딥러닝 모델이 문맥을 분석한 뒤, 혐오 표현을 자동 탐지해 모욕, 욕설, 폭력/위협, 범죄 조장 등 11가지 항목으로 분류한다. 여기에 해당 혐오 표현이 가진 심각성을 주의, 명백, 심각 등 3단계로 구분하고 순화 표현으로 대체한 결과를 같이 보여준다. 튜닙은 “최근 심각성이 대두되고 있는 AI 윤리 및 인터넷 혐오 문제를 해결하는 데 다양하게 응용할 수 있다”고 설명했다.

튜닙의 ‘비식별화’ API는 개인정보보호 및 데이터 활용에 유용한 제품이다. 정부에서 발표한 개인정보 비식별 조치 가이드라인에 따라, 사용자가 입력한 문장에서 이름, 주소, 전화번호, 주민등록번호 등 14개 개인정보 항목을 자동 판별해 삭제, 마스킹, 범주화 방식으로 비식별화한다. 마이데이터가 금융, 의료, 마케팅 등 다양한 분야에서 활용되는 상황에서 데이터 효용과 개인정보보호를 모두 실현할 수 있다는 특징이 있다. 

박규병 튜닙 대표는 “많은 기업이 영상인식 기반 API에 집중하고 있지만 우리는 자연어처리 분야에 집중해 기존에 없던 차별화된 API 제품을 준비했다”며 “윤리성 판별 등은 실제 현장에서 실용성과 유용성을 입증한 제품들로 고객 목소리를 반영해 서비스를 고도화하는 한편, 가치 있는 여러 API를 연달아 선보일 것”이라고 말했다.