[기고] AI 시대, 데이터 강국의 길
이재명 정부 출범 1년, 통계청이 국가데이터처로 새 출발한 것은 단순한 간판 교체가 아니다. 인공지능(AI)의 성능이 알고리즘 못지않게 학습 데이터의 품질과 신뢰성에 좌우되는 시대에 국가는 데이터를 행정의 부산물이 아니라 사회문제를 해결하는 핵심 인프라로 다뤄야 한다. 우리에게도 인구·고용·복지·산업·지역 데이터를 아우르는 방대한 자원이 있지만 그동안 부처와 기관의 벽을 넘지 못해 정책과 산업 현장에서 충분히 활용되지 못했다. 데이터처 출범은 이 단절을 해소하고 데이터로 국정을 설계하는 체계로 나아가는 출발점이다.
데이터처가 추진 중인 ‘국가데이터기본법’ 제정은 이를 뒷받침할 제도적 토대가 될 것이다. 핵심은 공공안전·재난 대응·사회문제 해결을 위해 활용 가치가 큰 데이터를 국가가 책임지고 지정·관리하는 데 있다. 부처와 민간이 안전하게 연계·결합·분석할 수 있는 길도 연다. 이는 흩어진 데이터를 모아 보자는 선언을 넘어 데이터 품질을 진단하고 메타데이터를 표준화하며 안전하게 활용하는 전 과정을 국가 책임 아래 두겠다는 의미다. 전문 지원 체계가 갖춰지면 데이터 보유기관의 부담은 줄고 민간의 혁신 속도는 빨라질 것이다.
다만 데이터 강국의 전제는 ‘많은 데이터’가 아니라 ‘믿을 수 있는 데이터’다. AI 연구의 무게중심도 모델 규모에서 학습 데이터의 질로 옮겨 가고 있다. 데이터처가 추진하는 AI 친화적 메타데이터와 통계 온톨로지는 생성형 AI의 환각을 줄이고 데이터의 출처·정의·산식·갱신 주기를 기계가 이해할 수 있게 만드는 핵심 장치다. 정확성, 완전성, 일관성, 시의성 같은 품질 기준이 함께 작동해야 결합 경로를 추적할 수 있고 국민·기업·연구자가 같은 데이터를 놓고 토론할 수 있다.
국민이 체감하는 변화도 이 지점에서 시작된다. AI를 활용해 품목별 가격 변동을 자동으로 분석하는 ‘상시 물가 모니터링 체계’나 통신, 기상 등 환경 변수를 융합해 안전사고를 예방하는 ‘인구 밀집도 예측’은 국민에게 시의성 있는 정보를 제공한다. 소득이동 데이터베이스(DB)·사회보장DB 같은 부처 간 융합데이터는 흩어진 정책 영역을 한 줄로 꿴다. 지역맞춤형 생활인구와 지역투자 동향 지표, 행정리별 생활 기반 통계지도도 부처 칸막이가 낮아져야 가능한 일이다. 고품질 데이터가 민간으로 흘러갈 때 새로운 비즈니스 모델과 데이터 산업의 자생력이 자란다.
동시에 국가데이터는 강한 권한만으로 성공할 수 없다. 개인정보 보호, 통계 비밀보호, 민간 데이터의 정당한 권리, 자료 제공 기관의 부담을 함께 살피는 신뢰의 규칙이 필요하다. 비식별화와 안전한 분석환경, 장기 보존과 폐기의 투명한 기준은 활용을 늦추는 장벽이 아니라 지속 가능한 활용의 안전장치다. 특히 민감한 데이터일수록 미개방 자료의 구조를 보존한 재현자료 확대 등 새로운 방식을 통해 외부 전문가와 국민이 납득할 수 있는 절차가 제도 안에 자리잡아야 한다.
AI 시대의 국가경쟁력은 데이터를 얼마나 빠르게 모으느냐보다 얼마나 책임 있게 연결하고 정확히 해석하느냐에 달려 있다. 그래서 정책이 평균이 아니라 생활의 차이를 보고 설계되도록 하는 것이 데이터 경쟁력의 핵심이다. 데이터처가 앞으로 범부처 협력의 중심에서 법과 기술, 신뢰를 함께 세워 간다면 한국은 데이터 소비국을 넘어 데이터로 정책과 산업 혁신을 이끄는 나라로 도약할 수 있다. 데이터처가 여는 데이터 강국의 길은 국민이 믿고 쉽게 쓰는 데이터 위에서 더 안전하고 공정하며 유능한 국가를 만드는 일이다.
이영섭 동국대 통계학과 교수