
김희원 숭실대 글로벌미디어학부 교수 연구팀은 지난달 미국 내슈빌에서 열린 컴퓨터비전 분야 최우수 국제 학술대회 ‘CVPR 2025(Conference on Computer Vision and Pattern Recognition 2025)’에서 연구 논문을 발표하고 ‘인공지능 로봇 조작 챌린지 세계대회(ARNOLD Challenge)’에서 1위를 차지했다. (사진=숭실대)
AI 로봇이 다양한 작업을 학습하려면 대규모의 고품질 데이터가 필수적이다. 그러나 실제 환경에서는 고품질 데이터의 대규모 수집에 막대한 시간과 비용이 소요된다는 어려움이 있었다. 연구팀은 텍스트 지시만으로 현실감 있는 로봇 조작 장면을 자동 생성하는 프레임워크 ‘DynScene’을 개발해 대량의 학습 데이터를 효율적으로 확보할 수 있는 방법을 제시했다.
김희원 교수는 “이 기술은 기초 모델과 생성 모델을 활용해 적은 양의 학습 데이터만으로도 로봇 조작을 정교하게 구현할 수 있다는 점에서 의미가 크다”며 “AI 기반 로봇 기술에 대한 진입장벽을 낮춰 대규모 데이터 확보가 어려운 기업들에게도 실질적인 도움이 될 것”이라고 설명했다.