최근 전 세계 로봇업계의 화두는 로보틱스 파운데이션 모델(RFM·Robotics Foundation Model)과 월드모델(World Model)이다. 대규모 로봇 데이터와 시뮬레이션을 학습해 로봇이 세상을 이해하고 미래를 예측하며 스스로 행동하도록 만드는 것이 목표다.
하지만 박종우 서울대 기계공학부 교수는 “현재처럼 트랜스포머 기반 AI 모델을 계속 키우고 여기에 로봇 데이터를 덧붙이는 접근만으로는 범용 로봇을 구현하기 어렵다”며 “로봇은 언어와 이미지 생성 AI와 근본적으로 다른 문제를 풀어야 한다”고 진단했다.
MIT 전기공학·컴퓨터과학 학사와 하버드대 응용수학 박사를 거친 박 교수는 한국인 최초로 미국 전기전자공학자협회(IEEE) 로보틱스학회(RAS) 회장을 지낸 세계적 로봇공학 권위자다.
박종우 서울대학교 기계공학부 교수 (사진=신영빈 기자)
박 교수가 강조한 핵심은 데이터의 양이 아니라 AI의 구조다.
그는 최근 주류로 떠오른 RFM과 월드모델에 대해 “방향 자체가 틀렸다는 뜻은 아니다”라면서도 “지금처럼 대규모 AI 모델을 키우는 것만으로는 로봇의 본질적인 문제를 해결하기 어렵다”고 말했다.
언어모델은 방대한 텍스트를 학습하면 성능이 높아지지만, 로봇은 물체를 잡고, 밀고, 비틀고, 끼우는 과정에서 힘, 마찰, 접촉, 변형, 충돌 등 복잡한 물리 현상을 동시에 다룬다. 그러나 현재의 트랜스포머 기반 AI는 이런 물리적 상호작용을 충분히 표현하거나 학습하기 어렵다는 것이 그의 진단이다.
박 교수는 “영상만으로 사람이 물체를 잡고 있다는 사실은 알 수 있지만 얼마나 강한 힘으로 잡고 있는지, 어떤 마찰이 발생하는지는 알기 어렵다”며 “로봇에는 운동과 접촉, 힘을 표현할 수 있는 새로운 언어가 필요하지만 아직 그런 공통 표현체계조차 없는 상황”이라고 설명했다.
◇“사람 뇌처럼 판단·운동·반사를 나눠야”
박 교수가 제시한 대안은 사람의 뇌를 닮은 계층형(Hierarchical) AI 아키텍처다.
사람은 대뇌가 무엇을 할지 판단하고, 소뇌와 운동계가 몸을 움직이며, 척수는 위험 상황에서 즉각 반사적으로 반응한다. 각각의 역할이 분리돼 있으면서도 유기적으로 연결돼 있다는 것이다.
그는 “지금의 파운데이션 모델은 이런 계층 구조가 아니다”라며 “상위에서는 작업 계획과 의사결정을 담당하고, 하위에서는 힘과 접촉, 운동을 실시간 제어하는 구조가 필요하다”고 말했다.
이어 “기존 AI 모델을 그대로 로봇에 적용하는 것이 아니라 계획과 제어, 역학을 함께 담을 수 있는 새로운 아키텍처를 고민해야 한다”며 “RFM이나 월드모델도 이런 계층형 구조 위에서 구현될 때 비로소 의미 있는 범용 로봇으로 발전할 수 있다”고 강조했다.
◇“시연 영상과 공장은 다르다…99% 신뢰성이 필요”
화려한 로봇 시연과 실제 산업 현장의 간극도 짚었다.
박 교수는 “사람들은 로봇이 걷거나 춤추고 빨래를 개는 영상을 보며 어려운 문제를 해결했다고 생각하지만, 실제 공장에서 더 어려운 일은 병뚜껑을 열거나 배선을 끼우고 좁은 공간에 부품을 정확히 삽입하는 작업”이라고 말했다.
이런 작업은 미세한 힘 조절과 접촉 제어가 핵심이어서 현재 AI가 가장 어려워하는 영역이라는 설명이다.
그는 AI 만능론에 대해서도 경계했다.
“AI가 필요한 영역은 분명 있지만 기존 제어공학과 기구학으로 충분히 해결 가능한 문제까지 모두 AI로 바꾸려는 접근은 위험하다”며 “AI가 무엇을 더 잘하는지 기존 방식과 객관적으로 비교해야 한다”고 말했다.
특히 산업 현장에서는 성능보다 신뢰성이 중요하다고 강조했다.
박 교수는 “연구실에서 10번 중 7번 성공하는 기술은 의미가 있을 수 있지만 공장은 다르다”며 “99% 이상 신뢰성이 확보되지 않으면 사용할 수 없고 AI는 실패 원인을 설명하기 어려운 점도 산업 적용의 리스크”라고 말했다.
◇“중국 경쟁력은 AI보다 액추에이터”
최근 중국 휴머노이드와 사족보행 로봇의 약진에 대해서도 AI보다 하드웨어 혁신을 더 중요한 배경으로 꼽았다.
특히 MIT 김상배 교수 연구팀이 제안한 QDD(준직결구동) 액추에이터 개념을 중국 기업들이 빠르게 상용화하면서 운동 성능을 크게 끌어올렸다고 평가했다.
그는 “중국이 강화학습만 잘해서 앞선 것이 아니다”라며 “액추에이터와 모터를 로봇에 맞게 설계했고 이를 대량 생산까지 연결한 것이 경쟁력의 핵심”이라고 말했다.
박 교수는 로봇 산업에서 “하드웨어는 이미 완성됐고 이제 AI만 남았다”는 인식도 경계했다.
예를 들어 사람 손처럼 말랑하고 마찰력이 있는 손가락은 복잡한 제어 없이도 물체를 안정적으로 잡을 수 있다. 반대로 딱딱한 손가락이라면 훨씬 어려운 AI 제어가 필요하다. 결국 좋은 하드웨어가 소프트웨어의 난이도까지 낮출 수 있다는 것이다.
그는 “문제의 본질을 먼저 이해한 뒤 하드웨어로 해결할지, 소프트웨어로 해결할지, 아니면 함께 풀지를 결정해야 한다”며 “로봇은 하드웨어와 AI가 함께 발전해야 하는 대표적인 융합 기술”이라고 강조했다.
이어 “로봇은 3~5년 안에 성과를 내는 산업이 아니라 20~30년을 바라보고 투자해야 하는 분야”라며 “하드웨어와 소프트웨어, 알고리즘과 설계를 함께 연구할 수 있는 대학의 역할이 앞으로 더욱 중요해질 것”이라고 말했다.









