본문 바로가기
도발과 생각들

공공데이터 개방과 활용

by chongdowon 2023. 3. 22.
728x90
  • 2021/06/30 16:41
우리나라는 다양한 공공데이터가 공개돼 있고 shp, csv 등 형태도 다양해서 쉽게 가공, 추출이 가능하다. 민간영역의 비전문가나 특정 영역의 취미를 하이엔드로 즐기는 사람들은 이 공공데이터를 가지고 다양한 자료로 만들어 낼 수 있다. 
공공데이터포털 data.go.kr에 들어가면 개방된 모든 자료를 내려받을 수 있도록 돼 있다. 
이 자료로 예전에 "중국음식점에 많이 사용된 상호" 와 같은 별것 아니지만 궁금할 수 있는 자료를 만들어 공유할 수 있었다.
 
최근에 캄보디아 농산물가격등락을 모니터링 해 보고 싶어서 혼자 볼만한 지수를 만들어 보는데, 사용할만한 공공데이터가 너무 부족하다. 대단한 자료를 만드는건 아니고 이미 캄보디아 정부가 운영하는 농산물시장정보가 업데이트가 잘 되지 않고, 자료추출이 어려워서 한눈에 볼 수 있는 자료를 만들어 보려고 하는 중이다.
 
캄보디아에서 공개되는 모든 자료는 기본적으로 PDF형태로만 공유되고, 그마저도 인쇄 후 스캔본을 PDF로 배포하는 방식이어서, 모든 자료는 직접 다시 입력해야 한다. 
또 자료들은 출처와 생성방식이 공개되어야 재가공할 때 활용할 수 있는데 이런 내용들이 전혀 공개돼 있지 않다. 예를 들어 상무부에서 발표하는 일일 시장가격의 경우 프놈펜 주요시장에서 가격을 조사해서 공개하고 있다. 문제는 기준가격인데 당해년의 기준가격은 당해 첫번째 시장을 연 날로 보통 1월 2일이다. 이 1월 2일의 가격기준이 공개돼 있지 않아서 확인해 본 결과, 전년도 마지막 시장평균가격이었다. 코로나 사태를 겪으면서 특정 시간에는 국영시장의 운영이 중단되기도 하고, 가격의 등락폭이 큰 적이 많았기 때문에 단순히 전년도 마지막 가격만으로는 지표로 삼기가 어렵다. 적어도 몇년간의 평균가격이라든가 최저, 평균, 최고가격이 같이 표시돼 있어야 참고할 수 있을 것이다.
 
게다가 지금까지 주요 캄보디아 농업생산자료를 30년 정도 모으고 있는데, 가끔 전년도와 숫자가 많지 않는 경우도 있어서 과연 이 자료들을 믿고 쓸 수 있을까 하는 고민이 들기도 한다. 분명히 자료를 만들 때는 엑셀을 썼을텐데 좌우, 상하의 합산이 틀리거나 소숫점을 잘못 찍는 경우가 많아서 두세 차례 확인을 해야만 숫자가 명확해진다.
 
공공데이터를 개방하지 못하는 이유는 두가지로 이해된다. 첫번째는 유료판매이다. 농업부와 기상청에 주로 자료를 요청하는데 판매를 한다. 가끔 Raw data를 요구하면 더 많은 비용을 요구한다. 물론 자료를 받아봐도 정리가 안 돼 있긴 마찬가지다. 두번째는 투명성이다. 워낙 수치를 정직하게 개방할 수 없는 경우가 많기 때문에 넓게 공유하기 어려울 것이다. 쌀 수출이 증가세에서 코로나로 둔화되던 첫달에 수출결과 공개를 늦추거나 앞뒤 맞지 않는 결과를 발표한 적이 있다.
 
투명성이야 말고 국민이 정부를 신뢰할 수 있는 근거가 되고 민간영역의 Think tank가 국가발전을 위해 무상으로 일할 계기가 될 것이다.
728x90