HyperCLOVA X SEED 8B Omni 결과물. 이미지=네이버클라우드
이번에 공개된 네이티브 옴니모델은 텍스트·이미지·오디오 등 서로 다른 형태의 데이터를 단일 모델에서 처음부터 함께 학습하는 네이티브 옴니모달 구조를 전면 적용했다. 옴니모달 AI는 정보의 형태가 달라지더라도 하나의 의미 공간에서 맥락을 통합적으로 이해할 수 있어, 말과 글, 시각·음성 정보가 복합적으로 오가는 현실 환경에서 활용도가 높다.
네이버클라우드는 옴니모달 AI의 잠재력을 극대화하기 위해 기존 인터넷 문서 중심의 학습을 넘어 현실 세계의 다양한 맥락을 담은 데이터 확보에 집중한다는 전략이다.
성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 “디지털화되지 않은 생활 맥락 데이터나 지역의 지리적 특성이 반영된 공간 데이터 등 차별화된 현실 세계 데이터를 확보하고 정제하는 과정이 선행돼야 한다”고 설명했다.
회사는 이번 모델 공개로 검증된 개발 방법론을 기반으로 향후 △차별화된 데이터의 본격적 학습 △단계적인 스케일업 △산업·일상 밀착 서비스에 필요한 특화 모델 생산을 효율적으로 이어갈 계획이다.
함께 공개된 고성능 추론모델은 자체 추론형 AI에 시각 이해, 음성 대화, 도구 활용 능력을 결합해 복합적인 요청을 해결하는 옴니모달 에이전트 경험을 제공한다.
글로벌 AI 평가 기관인 ‘아티피셜 애널리시스의 벤치마크 지수에서도 글로벌 주요 모델들과 유사한 성능 범위에 위치했으며, 특히 한국어 기반 종합 지식과 시각 이해, 에이전트 수행 능력 등 실사용과 밀접한 항목에서 우수한 성적을 기록했다.
해당 모델로 2026학년도 대학수학능력시험 문제를 풀이한 결과, 국어·수학·영어·한국사 등 주요 과목에서 모두 1등급에 해당하는 성과를 거뒀으며 영어와 한국사에서는 만점을 기록했다. 다수의 AI 모델이 문제를 텍스트로 변환해 입력해야 하는 것과 달리, 이 모델은 이미지 입력을 직접 이해해 문제를 해결했다는 점이 특징이다.
성 총괄은 “AI의 감각을 수평적으로 확장하는 동시에 사고와 추론 능력을 강화했을 때 현실 문제 해결력이 높아진다는 점을 확인했다”며 “이러한 기본기를 바탕으로 단순히 크기만 큰 모델이 아닌 실제로 쓰임새 있는 AI로 발전시키기 위한 스케일업을 이어갈 것”이라고 말했다.
네이버클라우드는 이번 모델을 기반으로 검색·커머스·콘텐츠 등 다양한 영역에서 활용 가능한 AI 에이전트를 단계적으로 확장할 계획이다.









