인텔 아크 프로 B70 GPU. (사진=인텔)
인텔은 이번 결과를 통해 하이엔드 워크스테이션과 데이터센터, 엣지(현장 단말) 애플리케이션을 아우르는 개방형·확장형 AI 솔루션의 경쟁력을 확인했다고 2일 밝혔다.
MLPerf(ML커먼스)는 전 세계 IT 기업들이 참여해 AI 모델 구동 능력을 겨루는 일종의 ‘AI 체력 검정’이다. 이번 v6.0 결과에 따르면, 4개의 GPU를 탑재한 인텔 아크 프로 B70/B65 시스템은 총 128GB의 VRAM(비디오 전용 메모리)을 바탕으로 1,200억 개의 파라미터(매개변수)를 가진 대규모 AI 모델을 높은 효율로 구동해냈다. 특히 아크 프로 B70은 이전 모델인 B60 대비 최대 1.8배 향상된 성능을 기록했다.
인텔은 이번 성능 향상이 단순한 하드웨어의 힘뿐만 아니라 소프트웨어 최적화의 결과라고 설명했다. 개방형 컨테이너 기반 소프트웨어 스택을 통해 동일한 하드웨어 환경에서도 이전 버전(v5.1) 대비 최대 1.18배의 성능 향상을 이뤄냈기 때문이다.
아닐 난두리(Anil Nanduri) 인텔 데이터센터 그룹 AI 제품 및 GTM 총괄은 “인텔 제온 6와 인텔의 아크 프로 B시리즈 GPU의 조합은 고객의 선택지와 가치를 확대하기 위한 인텔의 투자”라며 “전 세계 그래픽 전문가와 AI 개발자들에게 대규모언어모델(LLM)부터 전통적인 머신러닝(ML) 워크로드까지 해결할 수 있는 실질적인 솔루션과 최상의 성능 및 가치를 제공한다”고 설명했다.
최근 AI 시장은 데이터 보안(프라이버시)을 지키면서도 고가의 독점 AI 모델 구독 비용을 낮추려는 수요가 커지고 있다. 인텔의 새로운 시스템은 이러한 시장 변화에 맞춰 검증된 하드웨어와 소프트웨어를 결합한 ‘올인원 추론 플랫폼’을 지향한다.
특히 경쟁사 솔루션 대비 대규모 모델 구동 시 KV 캐시(AI가 대화의 맥락을 기억하기 위해 데이터를 임시 저장하는 공간) 용량을 최대 1.6배 더 많이 확보할 수 있어, 더 긴 문맥이나 복잡한 작업을 안정적으로 처리할 수 있다.
AI 추론 성능은 GPU뿐만 아니라 CPU의 역할도 중요하다. CPU는 전체 시스템의 효율성과 TCO(총소유비용, 제품 구매부터 운영까지 드는 전체 비용)를 결정짓는 핵심 요소로, 데이터 관리와 작업 배분을 담당한다.
인텔은 이번 벤치마크에 CPU 단독 성능 결과를 제출한 유일한 서버 프로세서 기업이다. P코어(성능 코어)를 탑재한 인텔 제온 6는 이전 세대 대비 1.9배의 성능 향상을 달성하며, 별도의 가속기 없이도 LLM 추론과 파이닝튜닝(미세조정) 작업을 효율적으로 수행할 수 있음을 증명했다. 인텔은 업계 AI 인프라의 핵심인 ‘호스트 CPU’로서의 입지를 더욱 공고히 한다는 전략이다.









