[디지털데일리 박세아 기자] 부산대학교가 20년째 무료로 제공 중인 '한국어 맞춤법·문법 검사기'에 초거대AI 학습용으로 추정되는 대규모 트래픽이 대거 유입돼 논란이 되고 있다. 관련 업계는 향후 유사한 사건이 반복될 수 있다고 지적하고 있다.
7일 부산대 '맞춤법 검사기' 운영자 측은 지난 5일 특정 IP들에서 비정상적인 이용패턴을 확인했고, 거대언어모델(LLM) 학습을 위한 목적이 의심된다고 공지했다.
지난 한 달간 특정 IP가 해당 검사기를 500만회 이상 사용하면서 업체가 사용하고 있는 AWS 클라우드 비용이 평소 대비 1.5배에서 2배가량 증가했다는 것이다. 검사기 개발사는 "서버 운영비가 과도하게 증가해 향후 맞춤법 검사기를 이용하려는 사업자(기업) 대상으로는 유료 서비스를 이용하도록 하겠다"고 밝혔다.
이에 관련 업계는 이번 트래픽 유발을 통해 맞춤법 검사기에 영향을 준 곳들이 초거대AI 기술 보유 기업이 아니라, 리소스를 기반으로 다른 애플리케이션 서비스를 만드는 업체일 가능성에 무게를 두고 있다. 초거대AI 기술 보유 기업은 이미 정제된 데이터셋이나 계열사 및 파트너사들이 보유하고 있는 전문 데이터나 문헌 데이터를 활용하고 있기 때문이다.
우선 이번 부산대 '한국어 맞춤법·문법 검사기'에 트래픽이 몰린 것은 특정 업체가 가지고 있던 데이터셋 중 한국어 텍스트의 맞춤법 등을 교정하는 데이터 전처리를 수행한 것으로 의심하고 있다.
업계 관계자는 "초거대 AI는 말 그대로 상당한 규모의 인프라를 바탕으로 대량의 데이터를 학습해서 파운데이션 모델을 만든다. 목적성에 맞게 데이터를 튜닝해서 개별 모델을 만드는 구조"라며 "파인 튜닝은 이미 파운데이션 모델 기반이기 때문에 맞춤법 검사기를 돌려서 데이터셋을 만드는 것에 의미가 없다"라고 말했다.
이어 이 관계자는 "굳이 이런 방식으로 데이터셋을 생산하는 것은 초거대AI 구조를 모르는 업체의 행위 가능성이 높다"라며 "초거대AI에 정통한 기업이 이런 소모적인 방식의 데이터 셋 생산 방식을 선택했을 리 없다"라고 말했다.
다만 문제는 검사기 업체에서 뿐만 아니라 앞으로 다른 업체도 향후 유사한 상황을 겪을 수 있다는 것이다. 실제 이미 다수의 텍스트 콘텐츠를 보유하고 있는 언론사들에 이른바 스크래핑 방식의 데이터 수집이 종종 발생하고 있다. 이 과정에서 디도스(DDoS)와 같은 트래픽 유발이 생겨 사이트가 먹통이 되거나 연결이 고르지 않는 문제 들이 발생한다. 이는 AI가 무차별적인 데이터를 수집하고 있다는 점에서 사이트를 운영 중인 대부분의 기업에게도 해당될 수 있다는 지적이다.
업계 또다른 관계자는 "최근 들어 AI 기술을 통해 새로운 서비스를 생산하려는 업체는 대부분 중소기업"이라며 "데이터 전처리에 필요한 비용을 줄이기 위해 언제든지 다른 서비스에 피해를 줄 수 있다"라고 설명했다.
한편 부산대 맞춤법 검사기 개발사는 "대규모 트래픽이 들어오면서 서버비 부담이 가중됐지만, 이들이 악의적 의도로 데이터를 입력했다고 보지는 않는다"라며 "다만, 향후 대용량 데이터 처리가 계속된다면 서비스 속도가 느려질 수 있기 때문에 사업 목적 데이터 처리는 유료로 이용해야 한다는 점을 확실히 할 것"이라고 밝혔다.
Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지
FAST는 무료 OTT?…“뉴 아이디, 스크린 기반 브랜드로 도약”
2025-04-26 07:00:00[DD퇴근길] 트럼프 주니어, 韓 찾는다…정용진 초청에 재계 총수 면담
2025-04-25 17:03:56SKT, 해킹사태 수습 ‘시험대’...“진상규명은 아직, 이용자 보호 집중”(종합)
2025-04-25 14:45:57신세계라이브쇼핑, 울릉도 관광 활성화 도모…“차별화된 여행 상품 운영”
2025-04-25 14:08:47[일문일답] SKT “진상규명 기다려달라...2중 3중 이용자 보호 집중”
2025-04-25 14:02:03[DD's톡] 'SKT, 카카오 지분 매각'에 양사 주가 희비 엇갈려
2025-04-25 11:31:10구글 모회사 알파벳, 1분기 '깜짝 실적'…광고 부문 성장 견인
2025-04-25 17:09:06경주 개관 미디어아트 전시관, '덱스터' 자회사가 만든다
2025-04-25 16:39:44[콘텐츠뷰] "겹사돈·전공의 미화 논란?"…정면돌파 택한 '언슬전생'
2025-04-25 16:02:21'2초 노출에 2500만원'…웹툰 플랫폼, 콘텐츠 넘어 '광고 신시장' 연다
2025-04-25 15:59:30MS, 혐한 논란에 사흘 만 공식 입장… “출시 지연에 사과”
2025-04-25 14:02:42[DD's톡] 고개 못 드는 엔씨 주가… ‘아이온2’가 구할까
2025-04-25 13:54:28