뉴스펍

[이데일리 임유경 기자] 국내 비전 인공지능(AI) 스타트업 슈퍼브에이아이가 산업 현장에 즉시 적용 가능한 AI 파운데이션 모델 ‘제로(ZERO)’를 공개했다. 텍스트 명령이나 이미지 예시만 입력하면 다양한 작업을 수행할 수 있는 점이 핵심 기술이다.

김현수 대표는 24일 기자간담회에서 “제로는 국내 최초의 산업 특화 비전 파운데이션 모델로, AI 도입의 패러다임을 바꿀 것”이라고 밝혔다. 제로는 대규모 이미지로 사전 학습된 범용 AI 모델로, 별도 추가 학습 없이 제조, 물류, 관제 등 다양한 산업 현장에 바로 활용할 수 있다.

김현수 슈퍼브에이아이 대표가 24일 서울 여의도 콘래드 호텔에서 연린 기자간담회에서 산업 특화 비전 파운데이션 모델 ‘제로’를 소개하고 있다.(사진=슈퍼브에이아이)

슈퍼브에이아이는 그동안 산업계에서 AI 도입 시 진입 장벽으로 작용했던 문제들을 모두 해소하는 데 방점을 두고 제로를 개발했다. 김 대표는 “많은 기업들이 AI 도입에 있어 전문 인력, 데이터, 인프라 부족 문제를 겪고 있다”며 “우리는 3가지 장벽을 허물기 위해 영상 AI 개발 솔루션인 ML옵스를 제공해 왔고, 여기에 그동안 축적한 산업별 AI 도입 전략과 노하우를 결합해 제로를 선보인다”고 소개했다.

제로를 구현한 핵심 기술력은 학습 과정을 생략해주는 ‘제로샷’ 추론이다. 김 대표는 “제로샷은 미리 학습되지 않은 유형의 업무에도 즉시 투입돼 동작할 수 있는 능력”이라며 “기존 AI는 데이터 수집·라벨링·학습이 필요했지만, 제로는 이미 방대한 산업 데이터를 학습해 추가로 데이터 학습 없이 바로 현장에 적용할 수 있다”고 설명했다.

텍스트뿐 아니라 이미지 프롬프트 입력이 가능하고 수행할 수 있는 작업에 제한이 없는 멀티태크스 모델이라는 점도 주요 특장점이다. 김 대표는 “제로는 텍스트 프롬프트뿐 아니라 예시 이미지로 프롬프트를 입력하는 것만으로도 어떤 지시든 가능하다”며 “예컨대 정상 나사의 이미지를 AI에 입력하면 파손된 나사를 찾아내는 게 가능하다”고 소개했다. 아울러 “주어진 영상의 맥락을 정확하게 이해할 수 있는 능력을 기반으로 개체 탐지뿐 아니라 추적, 사람 행도 인식, 질문에 대한 답변, 제품 검수 등 다양한 작업을 하나의 모델로 처리할 수 있다”고 언급했다.

파운데이션 모델 이름도 AI 도입을 가로막던 모든 장벽을 허물었다는 의미에서 제로로 명명했다는 게 김 대표의 설명이다. 그는 “데이터부터 학습, 복잡성, 대기시간, 도입 분야에 대한 한계까지 모두 제로로 만들어 누구나 즉시 AI를 도입해 무한한 혁신 사례를 만들 수 있다는 의미를 담았다”고 설명했다.

제로는 모델 성능을 글로벌 표준 벤치마크인 LVIS를 통해 입증했다. 특히 예시 이미지를 기반으로 다양한 객체를 탐지하는 ‘시각적 명령어 기반 객체 탐지’ 항목에서 세계 정상급 수준의 성능을 보였다. 또 현재 비전 AI 분야에서 가장 앞서 있는 중국 모델들(T-Rex2, DINO-X)이 2000만~1억 개 사이의 대규모 데이터셋을 사용한 것과 비교해, 제로는 단 90만 개의 데이터셋만으로 동등한 성능을 구현해 개발 효율성도 우수하다.

2018년 설립된 슈퍼브에이아이는 삼성, LG전자, 퀄컴, 현대차, SK텔레콤 등 100개 이상의 기업에 비전 AI 솔루션을 제공하며 490억원의 투자를 유치한 국내 대표 비전 AI 전문 기업이다. 한국, 미국, 일본 3개국에 진출해 있으며 31건의 특허를 보유하고 있다. 도요타도 슈퍼브에이아이의 ML옵스 플랫폼을 활용해 제조 AI를 개발한 것으로 알려졌다.

김 대표는 “제로를 통해 기업들이 별도의 AI 팀이나 대규모 인프라 투자 없이도 최첨단 AI 기술을 활용할 수 있는 시대를 열어가겠다”며 “제로 출시가 제조업 강국인 한국의 산업 경쟁력을 AI로 확장하는 데 기여하고 나아가 글로벌 AI 산업에서 대한민국을 비전 파운데이션 모델 분야 1위 국가로 자리매김하는 전환점이 되길 기대한다”고 말했다.

추가 학습 없이 바로 쓰는 산업용 AI, '제로' 출격

IT/과학