[디지털데일리 이상일기자] 정부가 발표한 디지털 뉴딜 정책엔 생소한 단어가 들어가 있다. ‘데이터 댐’이 그것이다. 데이터 댐이라는 용어는 말 그대로 데이터를 대량으로 저장하고 필요한 곳에 공급해 준다는 의미다.
여기에 덧붙여 과거 미국 루즈벨트 대통령이 ‘후버댐’을 중심으로 한 뉴딜정책을 펼친 것처럼 경제 부양의 중심으로 ‘데이터’에 집중하고자 하는 정부의 의지가 담기기도 했다.
정부는 공공기관이 가지고 있는 데이터를 시장에 공개하는 한편 각 산업별로 도움이 될 수 있는 양질의 데이터까지 선별, 저장, 활용하는 빅데이터 플랫폼 전략을 추진할 계획이다. 이른바 원천(RAW)데이터라는 ‘수원(水源)’은 풀고 데이터 가공까지 가능하도록 각 지류에 대한 수질관리까지 하겠다는 것이다.
우선 정부는 데이터 댐을 통해 현재 분야별 데이터 수집 초기단계에 있는 정부 공공 데이터 역량을 분야별로 풍부하게 데이터를 확충해 데이터의 다양성을 확보할 계획이다. 또, 표준화·통합 관리를 통해 데이터 활용 확산에 나서겠다는 전략이다.
이를 위해 공공데이터 14.2만개를 신속 개방하고, AI학습용 데이터 1300종 구축 등 데이터 확충을 추진한다. 이러한 데이터 관리의 인프라로 빅데이터 플랫폼을 적극 구축, 확대해 나갈 계획이다. 분야별 빅데이터 플랫폼을 기존 금융, 환경, 문화, 교통, 헬스케어, 유통소비, 통신, 중소기업, 지역경제, 산림 등 10개에서 30개로 확대할 계획이다.
정부가 공공 데이터 개방에 나선 것은 지난 2013년부터다. 당시 공공정보 제공 차단으로 논란을 빚은 ‘서울버스 앱’ 논란 이후 정부는 2012년 공공정보 개방 협의체를 시작으로 공공데이터 활용지원센터 개소 등 데이터 개방을 꾸준히 진행해 왔다.
하지만 민간과 결합해 이용되는 데는 한계가 있었다. 정부가 보유하고 있는 데이터가 많기도 하지만 체계적으로 분류되지 않았다는 지적도 나온다.
업계 관계자는 “민간 분야에서도 데이터 정제 및 카테고리화하는 데 시간이 걸리고 있는 상황”이라며 “공공 데이터의 경우도 저장에 초점이 맞춰져 있었지 활용에 무게 중심이 없었던 만큼 제대로 활용하려면 무조건 적 공개가 아니라 정제 작업이 우선돼야 한다”고 밝혔다.
정부가 분야별 빅데이터 플랫폼을 30개로 확대하는 것도 이러한 점을 반영한 것이다. 빅데이터 플랫폼 구축과 데이터 정제를 병행한다는 전략이다. 각 공공기관이 가지고 있는 데이터를 산업별, 용도별로 구별해 적재, 빅데이터 플랫폼을 구현한다는 계획이다.
예를 들어 최근 발주되고 있는 공공기관의 빅데이터 사업에서도 데이터의 품질을 확보하는데 초점을 맞추고 있다. 이들 기관은 데이터 현황조사, 데이터 목록 작성, 기본 정보 조사, 진단계획 등을 수립하는 ▲데이터 품질진단 계획 수립. 데이터 상세정보 분석, 데이터 표준 설계, 오류 유형 분류 등을 하는 ▲데이터 품질진단 시행, 오류 유형 별 관리 및 개선방안을 실행하는 ▲데이터 품질개선 계획 수립 ▲국가 공인 품질인증 방안 수립 등의 단계를 거쳐 데이터 품질 확보에 나서고 있다.
정부가 공공데이터 개방에 나서고 있지만 해결해야 할 과제도 있다. 이른바 민감 정보인 ‘개인정보’가 포함된 데이터의 경우다. 한 업계 관계자는 “정부의 데이터 공개정책 및 방향이 멈춘 적은 없다. 다만 개인정보 등의 처리에 있어 누군가 책임져주는 기관이 없다보니 이러한 정보를 제외하는 과정이 길어지고 어느 기관은 겁부터 내고 아예 데이터 공개를 늦추는 경우가 있다”고 지적했다.
때문에 공공부분의 데이터 공개 속도를 위해서는 중앙에 컨트롤 타워가 필요하다는 관측이다.
윤종인 행정안전부 차관을 위원장에 내정하며 이 달 출범을 앞둔 통합 개인정보보호위원회가 컨트롤 타워 역할을 할 것으로 기대되지만 이 역시 시행령 등 각론에서 세부적인 규정이 뒷받침되지 않을 경우 혼란은 여전할 것이란 지적도 나온다.
한 업계 관계자는 “신용정보법, 개인정보보호법 등 특정 법안을 타고 사업을 전개하려는 업체들의 움직임이 있다. 서로 법이 상충되는 만큼 자기 사업에 유리한 법안을 기반으로 사업 모델을 짜고 있는 셈인데 반대로 역풍을 맞을 수도 있어 우려되는 것도 사실”이라고 밝혔다.