[디지털데일리 이상일기자] 정부가 데이터 댐 전략의 일환으로 AI학습용 데이터 1300종 구축 등 데이터 확충에 나섰다.
또, 행안부는 데이터 댐 구축 위해 청년 인턴십 8000명을 모집해 정부기관 및 지자체 등에 분산시키로 했다. 이들은 디지털화 되지 않은 데이터를 디지털화 하거나, DB에 있는 것을 공공데이터포털로 이전하는 작업을 하게 된다.
그리고 이런 작업이 끝나고 데이터댐이 완성돼야 비로소 이를 기반으로 고부가가치 신사업이 하나 둘씩 창출될 수 있다. 데이터댐에서 양질의 데이터를 활용해 각종 모바일 앱 서비스를 사업화할 수 있는 것이다. 정부가 밝힌 58조원 규모의 디지털뉴딜 정책에 대한 진정한 양질의 고용창출 효과는 사실 이 단계에서부터 시작되는 것이다.
일각에서는 최근 정부가 추진하는 빅데이터 및 인공지능(AI) 사업에 왜 많이 노동력(사람)이 필요한지 의문을 제기한다.
이는 공공데이터를 수집 하고 처리하는 것이 빅데이터나 AI 등 자동화를 통해 신속하게 이뤄지는 것이 아니냐는 잘못된 인식 탓이다.
전문가들은 빅데이터나 AI모두 인간의 손을 타는 ‘전처리’ 작업이 필수라고 입을 모으고 있다. IT업계에서 속칭 ‘노가다’라고 표현할 만큼 철저하게 사람의 손길이 필요한 영역이다.
이 단계에서는 기계가 대체할 수 없다. 따라서 이를 두고 '쓰레기 일자리' 운운하는 것은 현실을 모르고 하는 소리다. 그리고 바로 이 부분에서 우리나라의 빅데이터, AI 경쟁력이 손해를 볼 수 밖에 없었던 영역이라는 지적이다.
인공지능 기업 ‘애자일소다’ 최대우 대표는 “우리가 보험개발원과 자동차파손이미지분석 사업을 하는데 우리는 20여명 규모로 30만장의 데이터를 분석했다. 그런데 중국은 연 인원 200여명에 사진도 2000만장을 분석하는 규모다. 초기에는 노동집약적 산업이 될 수 밖에 없는 것이 인공지능이다. 처음에는 사람이 가르쳐주며 해야 하는데 우리나라는 인건비와 물량 동원도 힘든 상황”이라고 말했다.
정부가 8000명의 인턴을 채용해 추진하는 '공동데이터' 정비 정책도 이러한 관점의 일환이다. 결국 빅데이터나 AI도 일정 수준 이상 올라가기 전까지는 노동집약적 산업이라는 점에서 우리나라의 빅데이터 경쟁력 확보와 일자리 창출이라는 두 마리 토끼를 잡겠다는 것이다.
물론 일각에선 데이터 전처리를 담당하는 인력이 단순 노동이나 파트타임에 그쳐 직업으로서의 가치는 없다는 지적도 하고 있다. 하지만 일의 성격 자체가 고부가가치가 낮기 때문에 무턱대고 고임금을 지불할 수 없는 것도 현실이다.
이번에 데이터댐 구축을 위해 진행되는 청년 인턴십에서는 디지털화 되지 않은 데이터를 디지털화 하거나, DB에 있는 것을 공공데이터포털로 이전하는 작업을 하게 된다. 업계 관계자는 “직관적으로 무슨 내용인지 모르는 DB를 알아볼 수 있는 데이터로 바꾸고. 개방할 수 없는 데이터는 제외하는 등의 작업이 이뤄질 것”이라고 전했다.
다만 인턴이 모든 작업을 주도적으로 할 수는 없고 보조하는 형태로 진행될 것이란 관측이다. 결국 직업으로서의 가치가 떨어질 수 밖에 없는 상황이다.
이에 대해 부동산 빅데이터 기업 ‘빅밸류’의 구름 연구소장은 “이들 인력이 빅데이터와 인공지능 전처리 작업을 통해 얻을 경험에 주목해야 한다. 이러한 기술이 어떤 흐름을 가지고 현업에 도입되는지 경험해야 전문 인력으로 성장할 수 있다”고 말했다.
인턴십을 거치더라도 빅데이터와 데이터 분석과 관련된 커리어를 가져간다는 보장은 없지만 여기서 얻은 경험이 향후 기업 업무에 있어 도움이 될 것이란 지적이다.
한편 이러한 전처리 작업이 진행돼도 공개되는 데이터를 기업이 사용하지 않으면 소용없다. 결국 생태계가 만들어져야 하는데 여기서 등장하는 것이 바로 정부의 ‘바우처’를 통한 데이터 활용 지원사업이다.
한 스타트업 관계자는 “인공지능을 교육하기 위해선 사람이 데이터를 입력하는 등 단순과정 등이 필요한데 데이터 바우처를 통해 해결할 수 있었다. 양질의 데이터 기반을 만들기 위해선 사람의 힘이 절대적인데 지원 사업으로 해결하는데 도움이 됐다”고 밝혔다.