“오픈AI, 음성 중심 AI 기기 준비중”…화면 없는 시대 성큼

해외

이데일리,

2026년 1월 02일, 오전 08:09

[이데일리 임유경 기자] 챗GPT 개발사 오픈AI가 내년 중 출시를 목표로 말로 작동하는 인공지능(AI) 기기 개발에 박차를 가하고 있는 것으로 전해졌다. 이는 메타, 구글, 테슬라 등 실리콘밸리 빅테크들이 이미 음성을 차세대 인터페이스로 채택한 것과 궤를 같이하는 행보로, 음성이 화면을 대체하는 시대가 앞당겨지고 있다는 평가다.

샘 올트먼 오픈AI 최고경영자(CEO)(사진=AFP)
1일(현지시간) 미 정보기술(IT) 전문매체 디인포메이션은 소식통을 인용해 오픈AI가 최근 두 달간 여러 엔지니어링, 제품 및 연구 부서를 통합해 음성 AI 기술을 전면 재설계하고 있다고 보도했다.

소식통들에 따르면 이 같은 조직 개편은 이르면 내년 출시가 예상되는 ‘음성 중심 개인용 디바이스’를 염두에 둔 포석이다.

오픈AI의 새 음성 모델은 훨씬 자연스러운 음성을 구현하고 실제 대화 상대처럼 끼어들기를 처리하며, 사용자가 말하는 도중에도 동시에 발화할 수 있을 것으로 전해진다. 이는 현재 모델들이 구현하지 못하는 기능이다.

또한 오픈AI는 스마트 글래스(안경)이나 화면 없는 스마트 스피커 등을 포함한 ‘디바이스 패밀리’를 구상하고 있으며, 단순한 도구가 아니라 동반자에 가까운 존재로 작동하길 기대하고 있는 것으로 알려졌다.

실제로 오픈AI는 지난해 5월 하드웨어 제품 개발을 위해 애플 제품 디자인을 총괄했던 조니 아이브의 스타트업 ‘io’를 65억달러에 인수했고, 애플 제품을 위탁생산하는 중국 공급업체 럭스셰어와도 계약을 체결했다.

아이브는 ‘기기 의존성’ 문제를 중요한 과제로 보고 있는 것으로 알려졌다. 그는 오디오 중심 디자인이 과거 소비자 기기의 ‘잘못을 바로잡을’ 기회로 보고 있으며, 보다 건강한 기술 사용 습관을 만드는 계기가 될 수 있다고 판단하고 있다고 디인포메이션은 전했다.

오픈AI뿐 아니라 주요 빅테크들은 최근 화면 비중을 줄이고 음성을 핵심 인터페이스로 대체하려는 움직임을 보이고 있다.

메타는 레이밴 스마트글라스에 5개의 마이크를 탑재해 시끄러운 환경에서도 대화를 또렷하게 들을 수 있도록 하는 기능을 선보였는데, 사실상 사용자의 얼굴을 ‘지향성 청취 장치’로 바꾸는 셈이다.

구글은 검색 결과를 대화형 음성 요약으로 바꿔주는 ‘오디오 오버뷰(Audio Overviews)’를 시험 중이며, 테슬라는 xAI의 챗봇 그록을 비롯한 대규모 언어모델을 차량에 통합해 내비게이션부터 공조 장치 제어까지 음성 대화로 처리할 수 있도록 하고 있다.

AI 스타트업들도 이 같은 ‘오디오 퍼스트’ 흐름에 뛰어들었지만 성과는 엇갈리고 있다. ‘휴메인 AI 핀’은 화면 없는 웨어러블 기기의 한계를 드러낸 실패 사례로 남았다. 이 밖에도 샌드바와 페블 창업자 에릭 미기코프스키가 이끄는 기업 등은 음성으로 작동하는 AI 반지를 개발 중이며, 출시 시점은 2026년으로 예상된다.

추천 뉴스