네이버클라우드의 네이티브 옴니모델 '하이퍼클로바 X 시드 8B 옴니'(HyperCLOVA X SEED 8B Omni) (네이버클라우드 제공)
네이버클라우드가 정부의 '독자 인공지능(AI) 파운데이션 모델' 프로젝트 주관 사업자로 추진 중인 '옴니 파운데이션 모델' 개발 과제의 첫 번째 성과를 29일 공개했다.
네이버클라우드는 국내에서 처음으로 네이티브 옴니모달 구조를 적용한 파운데이션 모델인 네이티브 옴니모델 '하이퍼클로바 X 시드 8B 옴니'(HyperCLOVA X SEED 8B Omni)과 기존 추론형 AI에 시각·음성·도구 활용 역량을 더한 고성능 추론모델 '하이퍼클로바 X 시드 32B 싱크'(HyperCLOVA X SEED 32B Think)를 각각 오픈소스로 공개했다.
텍스트·이미지·오디오 등 서로 다른 형태의 데이터를 단일 모델에서 처음부터 함께 학습하는 네이티브 옴니모달 구조를 전면 적용한 모델이다.
옴니모달 AI는 정보의 형태가 달라져도 하나의 의미 공간에서 맥락을 통합적으로 이해할 수 있어 말·글·시각·음성 정보가 복합적으로 오가는 현실 환경에서 활용도가 높다.
단일 모델 구조의 옴니모달 AI는 규모 확장이 상대적으로 용이하다.
이 모델은 텍스트 지시를 기반으로 이미지를 생성·편집하는 옴니모달 생성 기능도 갖췄다. 텍스트와 이미지의 맥락을 함께 이해해 의미를 반영한 결과물을 만드는 방식으로, 단일 모델에서 텍스트 이해와 이미지 생성·편집을 자연스럽게 수행한다.
세계 시장을 선도하는 AI 모델들이 제공해 온 기능으로, 해당 수준의 멀티모달 생성 역량을 확보했음을 보여준다.
네이버클라우드의 고성능 추론모델 '하이퍼클로바 X 시드 32B 싱크'(HyperCLOVA X SEED 32B Think) 벤치마크 (네이버클라우드 제공)
네이버클라우드는 향후 옴니모달 AI 에이전트 활용 가능성을 검증하기 위해 '하이퍼클로바 X 시드 32B 싱크'도 공개했다.
이 모델은 자체 추론형 AI에 시각 이해, 음성 대화, 도구 활용 능력을 결합해 복합적인 입력과 요청을 이해하고 문제를 해결하는 옴니모달 에이전트 경험을 구현했다.
글로벌 AI 평가 기관 '아티피셜 어날리시스'(Artificial Analysis)가 종합 지식·고난도 추론·코딩·에이전트형 과제 등 10개 주요 벤치마크를 종합해 산출한 지수 기준으로도 글로벌 주요 AI 모델들과 유사한 성능 범위에 위치한 것으로 나타났다.
영역별 평가에서는 한국어 기반 종합 지식, 시각 이해, 도구를 활용해 문제를 해결하는 에이전트 수행 능력 등 주요 능력 항목에서 우수한 성능을 기록했다.
대학수학능력시험 문제 풀이에서는 국어·수학·영어·한국사 등 주요 과목에서 모두 1등급을 거뒀다. 영어와 한국사는 만점을 기록했다. 다수의 AI 모델이 문제를 텍스트로 변환해 입력하는 방식과 달리 이미지 입력을 직접 이해하고 문제를 해결했다는 점이 차별화 요소다.
성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 "텍스트·시각·음성 등 AI의 감각을 확장하는 동시에 사고와 추론 능력을 함께 강화했을 때 현실 문제 해결력이 크게 높아진다는 점을 확인했다"고 말했다.
bean@news1.kr









