젠슨 황 엔비디아 CEO가 5일(현지시간) 미국 네바다주 라스베이거스 퐁텐블로 호텔에서 열린 엔비디아 CES 2026 라이브에서 기조연설을 하고 있다. (공동취재) 2026.1.6/뉴스1 © News1 황기선 기자
엔비디아가 'CES 2026'에서 차세대 인공지능(AI) 컴퓨팅 플랫폼 '루빈'(Rubin) 기반의 'DGX SuperPOD'를 공개했다고 7일 밝혔다.
DGX SuperPOD는 루빈 플랫폼에 탑재된 신규 칩과 시스템을 통합해 대규모 AI 워크로드를 가속하는 기반 설계다.
루빈 플랫폼은 △루빈 GPU △베라(Vera) CPU △6세대 NV링크 스위치 △커넥트X-9 슈퍼NIC(네트워킹 인터페이스)△블루필드-4 DPU(데이터 처리 유닛) △스펙트럼-6 이더넷 스위치 등 6개 핵심 칩으로 구성됐다.
엔비디아는 블랙웰(Blackwell) 세대 대비 추론 토큰 비용을 최대 10배 절감할 수 있다고 설명했다.
DGX SuperPOD의 핵심 구성은 'DGX 베라 루빈 NVL72' 시스템으로 8개 랙을 통합해 576개의 루빈 GPU를 탑재했다. 이를 통해 FP4 기준 28.8엑사플롭(ExaFLOPS)의 연산 성능과 600테라바이트(TB)의 고속 메모리를 제공한다.
각 NVL72 랙은 △루빈 GPU 72개 △베라 CPU36개△블루필드-4 DPU 18개를 결합해 단일 메모리와 컴퓨팅 공간처럼 동작하도록 설계됐다. 랙 전체가 하나의 AI 엔진처럼 구동되는 구조다.
엔비디아는 루빈 플랫폼이 긴 문맥 추론과 전문가 혼합(MoE) 모델 등 차세대 워크로드에 최적화됐다고 소개했다.
DGX 베라 루빈 NVL72와 DGX 루빈 NVL8 기반 루빈 DGX SuperPOD는 올해 하반기 출시 예정이다.
젠슨 황 엔비디아 CEO는 "AI 컴퓨팅 수요가 폭발적으로 증가하는 시점에 루빈 플랫폼은 훈련·추론 효율을 극대화할 해답이 될 것"이라며 "기업들이 차세대 모델과 에이전틱 AI 앱 구축을 가속할 수 있을 것"이라고 말했다
엔비디아 DGX 스파크·DGX 스테이션(엔비디아 제공)
엔비디아는프론티어급 오픈소스 AI 모델을 구동할 수 있는 'DGX 스파크'(DGX Spark)와 'DGX 스테이션'(DGX Station)도 공개했다. 두 시스템은 엔비디아 '그레이스 블랙웰'(Grace Blackwell) 기반으로 대규모 통합 메모리와 페타플롭(초당 1000조 회 연산)의 AI 성능을 제공한다.
DGX 스파크는 1000억 파라미터 규모의 AI 모델을, DGX 스테이션은 최대 1조 파라미터 모델을 로컬 환경에서 직접 실행할 수 있다.
DGX 스파크에는 엔비디아 AI 소프트웨어와 쿠다-X(CUDA-X) 라이브러리가 사전 구성돼 개발자와 연구자가 AI 모델을 구축하고 파인튜닝할 수 있도록 지원한다. 스테이션은 GB300 그레이스 블랙웰 울트라 슈퍼칩과 775GB 일관 메모리를 탑재해 초대형 모델을 처리할 수 있다.
엔비디아 관계자는 "DGX 스파크와DGX 스테이션을 통해 과거 데이터센터 수준의 연산이 필요했던 프론티어 AI 모델을 이제 책상 위에서도 실행할 수 있게 됐다"고 말했다.
젠슨 황 엔비디아 CEO가 31일 경북 경주시 경주예술의전당에서 열린 아시아태평양경제협력체(APEC) CEO 서밋에 참석해 최태원 대한상의 회장과 만나 AI슈퍼컴퓨터 'DGX스파크'를 선물하고 있다. (공동취재) 2025.10.31/뉴스1 © News1 김민지 기자
ideaed@news1.kr









