이재명 대통령이 지난해 9월 8일 서울 중구 서울스퀘어에서 열린 국가인공지능(AI)전략위원회 출범식에서 발언을 마친 뒤 자리로 향하고 있다. (사진=연합뉴스)
간담회에 참석한 기업들은 글로벌 시장에서 우리만의 독자적인 AI 모델이 살아남기 위해서는 무엇보다 양질의 데이터를 마음껏 활용할 수 있는 환경이 조성되어야 한다고 입을 모았다.
LG AI연구원은 AI 경쟁력의 핵심인 데이터 활용 범위를 넓히기 위해 합리적인 규제 정비가 선행되어야 함을 강조했다. 저작권 문제를 포함한 제도적 걸림돌이 해결된다면 민관 협력을 통해 세계적인 수준의 독자 모델 개발에 박차를 가하겠다는 의지를 보였다.
업스테이지 역시 한국어 AI의 기초 체력을 키우기 위한 데이터 인프라의 시급성을 지적했다. 국립중앙도서관에 납본된 도서들을 발 빠르게 데이터화하는 것은 물론, AI 학습 목적의 저작물 활용을 명확히 하는 TDM(텍스트·데이터 마이닝) 면책 규정 마련과 전문가의 사고 과정이 담긴 고품질 데이터셋 구축이 필요하다고 제안했다.
데이터의 질적 고도화와 공공 데이터 활용 방식에 대한 지적도 나왔다. SK텔레콤은 정부가 제공하는 공공 데이터가 실제 기업 현장에서 별도의 재가공 없이 즉시 학습에 적용될 수 있도록 검증 및 정제 체계를 대폭 강화해야 한다고 주문했다. 이와 함께 특정 분야에 특화된 데이터 확보와 모델의 성능을 객관적으로 측정할 수 있는 한국어 평가 데이터셋 확충, 민감 정보 처리에 대한 민간의 부담을 덜어주는 지원책 등을 함께 건의했다.
모티프테크놀로지스는 개별 기업이 대규모 한국어 데이터를 독자적으로 구축하기에는 한계가 명확하다는 점을 짚었다. 이에 따라 국내 AI 기업들이 공동으로 활용할 수 있는 국가 차원의 고품질 한국어 사전학습 데이터셋을 운영해야 한다는 대안을 내놨다. 특히 정부의 지원이 단순히 원천 데이터를 확보하는 수준에 그치지 않고, 실제 모델 학습에 필수적인 데이터 후처리나 가공 단계까지 폭넓게 확대되어야 한다고 강조했다.
임문영 상근부위원장은 “국가대표 AI기업이 참여하는 독파모 프로젝트의 성공이 모두의 AI, AI기본사회 구현의 출발점이라며, 이를 위한 데이터 확보 문제는 특정 부처, 기관의 역할이 아닌 범국가 차원의 숙제”라며 “이를 해결하기 위한 역량 결집과 속도감 있는 실효적 지원에 위원회가 앞장서겠다”고 밝혔다.
국가AI전략위는 지난 2월 의결한 ‘대한민국 인공지능 행동계획’을 바탕으로 범용 파운데이션 모델 확보와 국가 데이터 통합 플랫폼 구축 등 주요 과제들을 차질 없이 추진할 계획이다. 특히 이번 간담회에서 제기된 규제 혁파와 고품질 데이터 공유 생태계 활성화 방안을 정책에 적극 반영해 국내 AI 기업들이 글로벌 무대에서 경쟁력을 발휘할 수 있도록 뒷받침할 방침이다.









