KT, '믿음 2.0' 오픈소스 공개…정부 독자 LLM 프로젝트 참여

IT/과학

이데일리,

2025년 7월 03일, 오후 07:12

[이데일리 윤정훈 기자] KT(030200)(대표 김영섭)가 자체 개발한 한국형 초거대 언어모델 ‘믿:음 2.0’을 전격 오픈소스로 공개하며 국내 인공지능(AI) 기술 주권 확보를 위한 ‘소버린 AI’ 경쟁에 본격적으로 뛰어들었다.

‘믿:음’은 지난 2022년 6월 1.0 버전이 처음 공개돼 기가지니의 의도 해석, AI 컨택센터(AICC) 상담 요약 등에 활용되며 주목을 받았다. 그러나 이후 차세대 모델 개발 소식만 전해졌을 뿐, 오픈소스화가 이뤄지지 않아 궁금증을 자아냈다.

이번에 KT는 새로운 버전을 공개함과 동시에 이재명 정부가 추진 중인 ‘독자 AI 파운데이션 모델’ 프로젝트에 공식 참여 의사를 밝히면서 관심이 커지고 있다. 정부는 AI 주권 역량 강화를 위해 국내 AI 기업 및 기관 중심의 정예팀(컨소시엄 포함)을 선정해 그래픽처리장치(GPU), 데이터, 인재 등을 수요에 따라 지원할 계획이다.

KT 기술혁신부문 연구원들이 서초구 KT 우면연구센터에서 믿:음 2.0을 테스트하고 있다(사진=KT)


3일 온라인으로 열린 ‘KT AI 기술 간담회’에서 신동훈 KT Gen AI Lab장(CAIO)은 “믿:음 2.0은 KT의 기술력으로 스크래치부터 학습된 완전한 국산 모델로 한국 문화와 언어를 깊이 이해하는 능력이 핵심”이라며 “SK텔레콤이 외부모델 기반 미드트레이닝을 선택한 것과는 근본적 차이가 있다”고 언급했다.

정부 ‘소버린AI’ 정책에 정면 응답

KT는 ‘믿:음’ 시리즈를 통해 소버린 AI 실현을 주도하겠다는 의지를 분명히 했다. KT가 정의한 소버린 AI는 △사용자 데이터 주권 보장 △AI 선택권 보장 △한국적 가치 반영 △책임 있는 운영의 네 가지 철학을 기반으로 한다. 오승필 KT 최고기술책임자(CTO)는 “외산 오픈소스 모델을 쓴다 해도 한국적 데이터로 학습돼야 하며 데이터가 외부로 유출되지 않는 ‘한국형 운영구조’가 필수”라고 했다.

“믿음은 ‘베이스’일 뿐…‘프로’·‘멀티모달’로 진화 중”

‘믿:음 2.0’은 현재 110억 개 파라미터(베이스), 24억 개 파라미터(미니) 규모의 모델이 공개됐으며, 향후 멀티모달 기능을 지원하는 ‘프로(Pro)’ 버전도 순차적으로 출시될 예정이다.

KT는 마이크로소프트(MS)와 협력해 오픈AI의 GPT 기반 한국형 튜닝 모델도 병행 개발 중이다. 동시에 기업 수요에 맞춘 응용프로그램인터페이스(API)와 설치형(온프레미스) 모델도 다양하게 제공할 계획이다.

신동훈 랩장은 “모든 업무에 GPT 같은 초고성능 모델이 필요한 것은 아니다”라며 “도큐먼트 요약 등 경량 모델이 오히려 더 적합한 경우도 많아, ‘믿:음’은 중소기업, 공공, 금융, 교육 등 다양한 산업 분야의 생산성 향상을 목표로 한다”고 설명했다.

또한 KT는 MS·오픈AI와의 협업을 이어가면서도 자체 모델 개발을 지속하겠다는 방침도 분명히 했다. 신 랩장은 “GPT는 뛰어난 성능을 자랑하지만 비용이 크고, 데이터 주권 측면에서 한계가 있다”며 “KT는 기간통신 사업자로서 독자적인 AI 기술력 확보를 포기하지 않을 것”이라고 강조했다.

아울러 KT는 학습 데이터 수급 과정에서도 철저한 검증을 거쳤다고 밝혔다. 데이터 얼라이언스를 통해 저작권 문제가 없는 콘텐츠만을 확보했으며, 상업적 활용이 불분명한 회색지대 데이터는 전면 배제했다고 설명했다.

엔비디아 의존도 낮춰..국산 NPU 리벨리온 연동

하드웨어 면에서도 KT는 국산 대안 생태계 확장에 발맞췄다. 오 CTO는 “국산 AI 반도체 ‘리벨리온’과 협력해 신경망처리장치(NPU)기반 추론 모델을 국내 최초로 구현했다”며 “정부의 국산 AI칩 생태계 확산 전략과도 궤를 같이한다”고 밝혔다.

KT는 믿:음 2.0과 MS 기반 모델 모두를 B2B 중심의 수익 모델로 연결해 나갈 방침이다. 공공, 금융, 교육, 법률 등 수요 맞춤형 모델 제공을 통해 SI 기반 수익 창출을 계획 중이다. 향후 B2C 전환 여부도 내부적으로 검토하고 있다.

KT는 단순 모델 공개를 넘어 AI 커뮤니티와의 협력도 강화한다.“오픈소스를 실제로 활용할 수 있도록 튜토리얼, 최적화 도구, 툴 연계 방안을 함께 제공할 것이라고 밝혀 생태계 기여 의지도 내비쳤다.

신 랩장은 “정부가 보유한 양질의 공공데이터가 규제로 묶여 활용되지 못하고 있다”며 “파운데이션 모델 정책 성공을 위해선 공공데이터 개방 확대 등 제도적 보완이 시급하다”고 밝혔다.


이시간 주요 뉴스