양사는 ‘리벨리온 NPU 기반 레드햇 오픈시프트 AI(Red Hat OpenShift AI powered by Rebellions NPUs)’를 공식 발표하며, 기업 환경에서 늘어나는 AI 추론 수요에 대응할 수 있는 풀스택 기술을 제시했다.
이번 플랫폼은 레드햇 오픈시프트 AI와 리벨리온의 NPU, 그리고 고효율 LLM 서빙 엔진인 vLLM을 결합한 구조다.
특히 AI 추론 단계에서 반복적으로 부딪히는 인프라 비용 부담, 배포·운영 복잡성, 보안 요건을 해결하기 위한 기능을 중심에 두고 있다.
리벨리온은 자사 NPU가 GPU 대비 최대 3.2배 높은 에너지 효율을 제공하며 서버·랙 단위의 데이터센터 구축 및 운영비를 낮출 수 있다고 설명했다.
또한 주요 오픈소스 프레임워크 지원과 풀스택 소프트웨어 구성으로 개발 환경 역시 GPU와 유사한 수준으로 단순화했다는 점을 강조했다.
레드햇 인증 오퍼레이터(Rebellions NPU Operator)를 통한 온프레미스 및 멀티클라우드 지원도 플랫폼의 핵심이다. 이를 통해 기업은 데이터 주권을 유지하면서도 고처리량·저지연 추론 워크로드를 안정적으로 운영할 수 있다.
주요 기능은 ▲vLLM 기반 고효율 추론 ▲온프레미스 보안 및 규제 준수 ▲GPU처럼 운영 가능한 통합 관리 환경 ▲코어~엣지까지 선형 확장 가능한 인프라 등으로 구성된다.
양사는 코오롱베니트와 공동 세미나를 열어 솔루션을 소개하고, 생성형 AI 도입 시 기업이 직면하는 현실적 문제들을 논의할 예정이다.
박성현 리벨리온 대표는 “AI 서빙·추론이 본격화되며 기업은 성능·비용·데이터 주권을 모두 충족시키는 인프라를 원하고 있다”며 “레드햇과의 협력은 오픈소스를 기반으로 하드웨어부터 모델 서빙까지 통합된 추론 플랫폼을 제공하는 첫 사례가 될 것”이라고 말했다.
브라이언 스티븐스 레드햇 AI 수석부사장 겸 CTO는 “엔터프라이즈 AI는 특정 독점 구조를 넘어 다양한 아키텍처 선택권을 필요로 한다”며 “리벨리온 NPU와 오픈시프트 AI의 결합은 효율성과 저지연성, 수평 확장성을 요구하는 기업에 새로운 대안을 제시한다”고 밝혔다.









