공공데이터의 양(量)에서 질(質)로 눈을 돌리면 개방에 가려진 문제점이 그대로 드러난다. 데이터 개방 물량은 많지만 실제 연구에 활용할 수 있는 데이터는 별로 없다는 게 대부분전문가들의 지적이다. 정부가 공개한 수많은 공공데이터 중 AI를 위한 기계학습 가능 데이터는 1%도 안 된다는 분석도 있다. 민간의 데이터 수요 파악과 표준화, 적시 사용이 가능한 데이터 전처리 등은 여전히 미흡하다는 얘기다.
공공데이터 활용이 미흡한 것은 국내 클라우드 시장이 협소한 데서도 확인된다. 공공데이터 개방과 클라우드 산업 간 선순환이 이뤄지는 미국 등 선진국과 차이가 크다. 데이터 활용에 제약이 많다 보니 기업들의 클라우드 전환이 늦어지고, 클라우드 산업도 성장하지 못하는 악순환이 계속되고 있다.
정부는 범정부 공공데이터 정책 방향을 담은 ‘제3차 공공데이터 기본계획(2020~2022)’을 수립할 계획이라고 하지만, 경제적 부가가치를 창출하는 산업의 활성화를 위한 제도 혁신 속도가 너무 느리다. 선진국에 비해 출발 자체가 한참 늦었는데도 ‘데이터 3법(개인정보보호법·신용정보법·정보통신망법 개정안)’이 아직도 국회를 통과하지 못한 게 대표적인 사례다. 법이 통과돼도 현실에서 어떻게 적용하느냐는 또 다른 과제다. 공공데이터 개방지수 OECD 1위가 의미를 가지려면 ‘데이터를 가장 잘 쓰는 나라’가 구호가 아니라 현실이 돼야 할 것이다.
관련뉴스