행정안전부는 인공지능(AI)이 학습과 분석에 바로 활용할 수 있는 ‘AI-Ready’ 개념을 공공데이터에 최초로 도입하고, 세부 기준과 관리 체계를 마련할 계획이다.
인공지능 혁신이 가속화되면서 인공지능이 읽고, 이해하고, 바로 활용할 수 있는 고품질 데이터가 핵심 요소로 부각되고 있으며, 미국, 영국 등 해외에서는 ‘AI-Ready 데이터’ 관련 연구와 논의가 활발히 전개되고 있다.
우리나라 공공데이터 정책은 OECD 공공데이터 평가에서 4회 연속 세계 1위를 달성하는 등 그간의 성과를 인정받아 왔으나, 인공지능 시대가 도래하면서 공공데이터 정책도 인공지능을 중심으로 전환할 것을 요구받고 있다.
지금까지 공공데이터는 인공지능이 직접 읽기 힘든 포맷으로 제공되거나, 갱신 주기, 요약 통계 등 속성정보가 불충분해 인공지능이 이해하고 활용하기 어려운 경우가 발생했다.
또한, 기관별로 주소, 행정코드 등을 제각각 표기하는 등 표준화가 되지 않아 데이터 연계가 어렵거나, 결측‧오류가 포함되는 등 데이터 품질이 낮아 사용자가 추가로 가공‧정제에 비용을 들이는 경우도 많았다.
이에, 행정안전부는 인공지능이 학습·분석·추론 등에 쉽게 활용할 수 있도록 정제·가공된 공공데이터인 ‘AI-Ready 공공데이터’의 개념을 다음과 같이 제시하고, 세부 기준과 관리 방안을 마련할 계획이다.
첫째, 인공지능이 검색·활용 시 직접 읽고 이해할 수 있는 데이터 포맷(형식)으로 제공하고, 풍부한 속성정보를 메타데이터로 제공해야 한다.
* 속성정보 : 완결성·결측률 등 요약 통계, 갱신 주기, 변경 이력 등
* 메타데이터 : 데이터의 작성자, 생성일, 파일크기 등 데이터를 설명하는 정보를 의미
둘째, 인공지능이 학습·분석 등에 활용하기 좋도록 주소, 행정코드 등 식별 값에 표준코드를 적용하고, 인공지능 서비스의 정확성‧신뢰성을 위한 데이터 품질기준*을 만족해야 한다. * 시계열성, 완결성, 범용성 등
행정안전부는 전문가를 중심으로 실무단(워킹그룹)을 운영해 ‘AI-Ready 공공데이터’의 세부 기준을 마련하고, 관리 방안을 담은 지침(가이드라인)을 올해 마련해 배포할 계획이다.
아울러 공공데이터포털에 개방된 데이터의 ‘AI-Ready’ 수준을 진단하고, 인공지능 활용성이 높은 데이터를 중심으로 ‘AI-Ready 공공데이터’ 기준을 우선 적용한 후 공공기관 전체를 대상으로 점차 확대할 방침이다.
윤호중 장관은 “데이터는 AI 경쟁력의 원천”이라고 강조하며, “정부는 AI가 활용하기 좋은 고품질 공공데이터를 풍부하게 개방해서 혁신적 서비스 창출과 산업 경쟁력 제고를 위해 힘쓰겠다”고 밝혔다.