HPE는 17일 서울에서 차세대 AI 시대를 겨냥한 ‘HPE AI 팩토리 위드 엔비디아(HPE AI Factory with NVIDIA)’의 고도화된 신규 솔루션을 발표했다. 이번 발표의 핵심은 양사가 공동 개발한 턴키 방식의 AI 팩토리 솔루션인 ‘HPE 프라이빗 클라우드 AI(HPE Private Cloud AI)’에 새로운 에이전틱 AI 관리 및 데이터 파이프라인 최적화 기능을 추가한 점이다.
에이전틱 AI는 인텔리전스가 스스로 적응하고 진화하며 협업·관리하는 차세대 AI 기술을 뜻한다. HPE는 기업들이 비즈니스 프로세스 자동화와 의사결정을 위해 AI 에이전트를 도입하는 과정에서 발생하는 보안 우려와 토큰 비용 문제를 해결하는 데 집중했다.
우선 에이전트의 안전한 개발과 배포를 위해 엔비디아 네모트론 오픈 모델, 엔비디아 네모클로, 엔비디아 오픈쉘 보안 런타임 등이 포함된 ‘엔비디아 에이전트 툴킷’을 통합했다. 이를 통해 에이전트의 동작을 모니터링하고 정책을 적용해 배포 리스크를 줄일 수 있다. 아울러 고성능 데이터 처리를 위해 엔비디아 베라(Vera) CPU가 탑재된 ‘HPE 프로라이언트 컴퓨트 LD394 젠12’ 서버를 라인업에 추가했다. 악성 에이전트 활동을 식별하고 시스템을 초기 상태로 복원하는 ‘HPE 젤토’ 소프트웨어 기능과 중앙 집중식 정책을 준수하는 로컬 에이전트 등록 기능도 함께 제공된다.
AI 도입의 병목 구간으로 꼽히는 비정형 데이터 처리 파이프라인도 개선했다. ‘HPE 알레트라 스토리지 MP X10000’의 내장 인텔리전스를 통해 메타데이터와 거버넌스 정책을 자동 적용함으로써 토큰 응답 시간을 최대 20배 단축하고 프롬프트 처리 효율을 높여 토큰 처리량을 최대 20%까지 향상시켰다. ‘HPE 데이터 패브릭 소프트웨어’는 모델 컨텍스트 프로토콜(MCP) 지원을 아파치 에어플로우로 확장해 데이터 가용성을 넓혔다.
이밖에도 비용 최적화를 위해 통합 모델 게이트웨이, 능동적 워크로드 우선순위 지정, 최대 256개 GPU 지원 다중 노드 추론 기능을 도입했으며, 엔비디아 NeMo를 통한 사전 학습 모델의 파인튜닝도 지원한다.
대규모 및 소버린 AI 팩토리를 위한 보안 역시 한층 강화됐다. HPE 서비스(HPE Services)를 통해 온프레미스 및 소버린 환경의 모델과 개인 데이터를 실시간 보호하는 ‘엔비디아 컨피덴셜 컴퓨팅’을 통합했다. 엔비디아 블루필드 및 엔비디아 DOCA를 활용해 제로 트러스트 정책과 런타임 위협 탐지를 수행한다. 향후 대규모 아키텍처에는 엔비디아 RTX PRO 6000 블랙웰 서버 에디션 GPU, 스펙트럼-X 이더넷, 블루필드-3 DPU, 커넥트X-8 수퍼NIC 등이 함께 제공될 예정이다.
안토니오 네리 HPE 사장 겸 최고경영자(CEO)는 “AI가 점차 자율적으로 발전함에 따라, 기업은 이를 안전하게 운영하고 책임감 있게 관리하며 경제적으로 확장할 수 있는 새로운 아키텍처를 필요로 한다”며 “HPE는 네트워킹, 서버, 스토리지 및 소프트웨어 전반에 걸쳐 엔비디아와 함께 에이전틱 기업의 기반을 구축하는 풀스택 AI 솔루션을 제공하고 있다. 이를 통해 고객은 통제력과 신뢰를 바탕으로 실험 단계를 넘어 실제 운영 단계로 나아갈 수 있다”고 말했다.
젠슨 황 엔비디아 CEO는 “AI 에이전트 시대를 맞아 컴퓨팅 스택의 모든 레이어가 재창조되고 있다”며 “엔비디아는 HPE와 협력하여 엔비디아 베라 CPU, 가속화된 인프라, 안전한 AI 소프트웨어로 구동되는 새로운 컴퓨팅 시대를 위한 AI 팩토리를 구축했으며, 기업들이 데이터를 인텔리전트 액션으로 혁신할 수 있도록 지원하겠다”고 밝혔다.









