현장에 필요한 데이터 모으고, 더 쉽게 활용하도록 개방 추진

IT/과학

이데일리,

2026년 5월 28일, 오후 04:24

[이데일리 강민구 기자] 과학기술정보통신부는 행정안전부, 문화체육관광부, 개인정보보호위원회, 국가데이터처 등 관계부처와 28일 정부서울청사에서 ‘데이터 관계장관회의’를 열고, ‘AI 대전환 시대 데이터 정책 추진방향’을 발표했다.

정부는 우선 민간이 필요로 하는 고품질 데이터를 확보하기 위해 핵심·고수요 데이터를 전략적으로 확충하기로 했다. 분야별 전문가를 활용해 고품질 추론데이터(CoT), AI안전·신뢰성 데이터셋, 성능 벤치마크 평가 데이터를 구축하고, 멀티모달·고난이도 데이터 등 독자 AI모델 개발에 필요한 핵심 데이터를 확충한다. 부처와 기관 등이 각각 구축해 관리 중인 AI학습용데이터 현황을 점검할 계획이다.

공공데이터 개방도 확대한다. 민간 수요가 큰 ‘AI·고가치 공공데이터 Top 100’을 개방하고, 정책연구 보고서, 국가자격시험 문답 데이터 등 비정형 공공데이터를 AI활용이 쉬운 형태로 개방한다.

특히 피지컬AI·제조, 모빌리티 등 업종·분야별 특성을 반영해 AX 활용성이 높은 특화데이터를 확보한다. 공공·범용 데이터는 공개·개방하되 개방이 어려운 데이터는 분야별 공유 협력 체계를 마련할 방침이다.

모든 데이터가 모이고 연결되는 ‘데이터 고속도로’도 구축한다. 민간·공공데이터를 쉽게 찾고 활용하도록 데이터 간 연계와 개방을 확대한다. 데이터 소재 정보를 제공하는 국가 데이터 통합플랫폼을 중심으로 플랫폼 간 연계를 강화하고, 품질인증·가치평가 정보 제공 등 기능을 강화한다.

다량의 AI학습용데이터가 집적된 ‘AI허브’ 플랫폼도 AI학습용데이터 통합제공시스템으로 개편하고, 공공·민간, 정부사업에서 나오는 AI학습용데이터를 개방할 계획이다.

이 밖에 AI학습 등에 필요한 데이터의 개방·활용을 가로막는 각종 법·제도는 개선한다. AI 학습·저작물 활용 관련 특화 상담창구를 운영하고, AI학습을 위한 저작물 활용, 저작자의 권리보호 방법 등을 포함한 ‘저작권법’ 개정 필요성도 검토한다.

또 민간 주도 데이터 생태계 조성도 지원하기 위해 민간의 자생적 거래 시장 활성화를 위해 AI 학습용 데이터 구매비용에 대한 세액공제를 적용하고, 저작권 보호와 AI산업발전을 균형있게 고려한 표준계약서와 저작권 배상보험 출시·가입지원도 추진한다.

정부는 이번 논의를 바탕으로 과제 별 추진계획을 구체화해 법정 기본계획 수립을 추진하는 등 AI시대에 맞는 데이터 정책을 추진해나갈 예정이다.

배경훈 부총리 겸 과기정통부 장관은 “AI경쟁력, 성능향상의 80%를 차지하는 것이 ‘데이터’이지만, 업계·현장에서는 여전히 풀기 어려운 숙제”라며 “AI혁신의 골든타임 내에 현장에서 필요한 데이터를 적시에 활용하도록 관계부처가 원팀(One-team)으로 지원하겠다”고 말했다.

비전, 추진전략.(자료=과학기술정보통신부)

추천 뉴스