과기정통부는 자율주행 AI 개발에 필요한 학습데이터를 국내 기업, 대학, 연구기관이 함께 구축하고 상호 공유할 수 있도록 지원하기 위해 ‘자율주행 E2E 데이터 구축 가이드라인 및 규격 정의서’를 발간했다고 19일 밝혔다.
과학기술정보통신부 /뉴스1
다만 E2E 방식은 대규모 학습데이터 확보가 필수적이다. 웨이모, 바이두 등 글로벌 선도 기업도 실증 거리를 확대하며 학습데이터 구축량을 늘리는 데 주력하고 있다.
국내에서는 기업과 기관이 자율주행 학습데이터를 개별적으로 구축해왔다. 차종별 센서 위치나 구성 방식이 다를 경우 학습데이터를 서로 공유하기 어려워 데이터 부족 문제가 지속됐다. 과기정통부는 이 같은 문제가 데이터양과 AI 성능이 비례하는 E2E 방식 기술개발의 병목으로 작용해 왔다고 보고 있다.
이번 가이드라인은 자율주행 E2E AI 학습데이터 구축 전 주기를 포괄한다. 데이터 수집, 가공, 정합·보정, 라벨링 등 학습데이터 구축 절차를 정의하고, 센서 구성과 저장 포맷 등 수집 시스템 요구사항과 원시데이터 검증 방법을 제시했다.
또 시나리오 선별 등 데이터 가공 방법, 위치 보정과 공간 정합 등 정합·보정 방법, 라벨링 항목과 학습데이터 세트 규격 등을 정리했다. 이를 기반으로 구축한 학습데이터 사례도 함께 담았다.
이번 가이드라인은 범부처 자율주행 연구개발(R&D) 사업인 ‘자율주행기술개발혁신사업’의 성과 중 하나다. 해당 사업은 2021년부터 2027년까지 과기정통부, 산업통상부, 국토교통부, 경찰청이 협업해 추진하고 있다.
가이드라인은 정보통신기획평가원(IITP), 자율주행기술개발혁신사업단(KADIF), 한국전자통신연구원(ETRI)이 함께 과제 목표를 상향 조정하며 개발했다. ETRI가 개발을 주도했다.
과기정통부는 2025년 말 가이드라인 초안을 마련한 뒤 올해 한국 ITS 학회 특별세션과 자율주행 산·학·연 간담회 등을 통해 업계와 전문가 의견을 수렴했다. 향후 국토교통부와 협력해 도시 단위 대규모 E2E AI 학습데이터 구축을 지원하는 자율주행 실증도시 등에 실제 적용하며 보완해 나갈 계획이다.
가이드라인은 자율주행기술개발혁신사업단 홈페이지에서 확인할 수 있다. 학교, 기업, 연구소 등 가이드라인을 활용하려는 누구나 자유롭게 열람할 수 있다.
박태완 과기정통부 정보통신산업정책관은 “이번 가이드라인을 통해 공동 활용 가능한 자율주행 데이터 체계가 구축되고, 고품질 데이터 기반의 자율주행 기술력을 확보할 수 있는 토대가 마련됐다”며 “향후 관계부처와 지속 협의하고, 2024년부터 매년 개최 중인 자율주행 AI 챌린지에도 연계해 실질적으로 활용되고 성과를 창출할 수 있도록 노력하겠다”고 말했다.









