카카오 데이터센터 안산 전경(사진=카카오)
이번 사업은 정부가 AI 핵심 인프라인 GPU를 민간에 지원하는 국책 과제로, 카카오는 지난 8월 최종 사업자로 선정됐다. 총 2424장의 엔비디아의 블랙웰 기반 최신 GPU ‘B200’을 확보해 5년간 위탁 운영하며 국내 AI 연구·개발 환경을 지원할 예정이다.
GPU 인프라는 경기도 안산에 위치한 카카오 데이터센터 안산을 기반으로 구축됐다. 카카오는 자체 데이터센터 운영 경험과 GPU 클러스터 구축 노하우를 바탕으로 장비 조기 확보, 사전 기술 검증(PoC) 등을 통해 구축 일정을 앞당겼다고 설명했다. 고집적 GPU 서버 운영을 위해 안정적인 전력 공급과 함께 ‘열복도 밀폐 시스템(Hot Aisle Containment)’을 적용해 냉각 효율도 높였다.
카카오는 하드웨어 제공과 함께 소프트웨어 환경도 지원한다. 국가 AI 컴퓨팅 자원 지원 포털과 연동해 카카오클라우드로 바로 접속할 수 있도록 했으며, 머신러닝 워크플로우를 자동화할 수 있는 AI 플랫폼 쿠브플로우(Kubeflow)를 제공한다.
현재 구축을 완료한 255노드에 대한 네트워크·성능 테스트가 진행 중이며, 내년 1월 2일부터 과학기술정보통신부와 정보통신산업진흥원이 공모를 통해 선정한 산·학·연 과제를 대상으로 베타서비스를 시작할 예정이다.
김세웅 카카오 AI시너지 성과리더는 “대규모 GPU 인프라의 안정적 구축과 운영은 AI 경쟁력의 핵심”이라며 “카카오의 데이터센터와 클라우드 역량을 기반으로 국내 AI 생태계 발전에 기여하겠다”고 말했다.









