리리아 3에 눈사람 사진만 입력해도 어울리는 분위기의 음악을 생성해 줬다. 영어로된 가사를 한국어로 바꿔달라고 요청하자 개사를 해줬고, 이를 바탕으로 음악을 다시 만들어 달라고 하니 한국어 가사가 반영된 음악이 나왔다. 2026.03.13. © 뉴스1 신은빈 기자 (제미나이 내 '리리아 3' 실행 화면 갈무리)
구글은 자사 생성형 AI 제미나이에 탑재한 '리리아 3'(Lyria 3) 베타 버전을 최근 모바일 애플리케이션(앱)에도 적용시켰다.
제미나이를 켜고 프롬프트(명령어) 입력창의 '도구' 배너에서 '음악 만들기' 기능을 실행하면 된다. △포크 발라드 △레게톤 △삼림욕 △K팝 △90년대 랩 등 총 16개의 트랙을 선택할 수 있는데, 원하는 트랙을 고르고 생성하려는 음악의 분위기나 세부요소를 프롬프트로 입력하면 몇 초 내로 음악이 생성된다.
제미나이의 이미지 생성 AI 모델 나노 바나나가 만든 앨범 커버 아트는 덤이다.
제미나이에서 리리아 3를 처음 실행하면 16종의 트랙을 고를 수 있다. 트랙을 선택하고 사진을 입력하면 알맞은 분위기의 음악을 생성해 준다. 2026.03.13.© 뉴스1 신은빈 기자 (제미나이 내 '리리아 3' 실행 화면 갈무리)
리리아 3를 직접 이용했을 때 가장 크게 느낀 특징은 '간편함'이었다. 리리아 3는 텍스트를 길게 입력할 필요 없이 사진 1장만 전송해도 음악이 뚝딱 나온다.
특히 AI가 시각물의 분위기를 포착하고 '영감을 받아' 음악을 생성한다는 점이 독특하게 느껴졌다. 물론 실제로는 시각물에 드러난 요소를 조합하고, 학습 데이터를 기반으로 어울리는 분위기를 매칭하는 식일 수 있으나 이미지 특성이 반영된 트랙과 가사를 빠르게 생성하는 모습은 이용자의 이목을 끌기 충분해 보였다.
음원을 몇 초 안에 만들어 주는 덕분에 유튜브·인스타그램·틱톡 등 온라인 플랫폼 숏폼(짧은 동영상) 제작에도 수고를 상당 부분 덜 수 있을 듯했다.
지난 겨울 일본에서 촬영해 온 시골 마을 기찻길 사진을 삽입하고 '삼림욕' 트랙을 선택하자 리리아 3는 시냇물 소리를 기반으로 따뜻한 아날로그 신디사이저가 어우러진 음악을 내놨다.
직접 만든 눈사람 사진을 트랙이나 프롬프트 없이 전송했을 때는 "사진 속 귀여운 눈사람과 고요한 겨울 풍경에서 영감을 받았다"며 '따뜻하고 몽환적인 분위기의 베드룸 팝' 곡을 추출해 줬다.
가사를 원하는 언어로 바꾸는 작업도 간단하다. 앞서 제작된 눈사람 음악의 영어 가사를 한국어로 바꿔서 음악을 다시 생성해 달라고 부탁하자 한국어 가사와 함께 새 음악이 나왔다.
현재는 한국어·영어·독일어·스페인어·프랑스어·힌디어·일본어·포르투갈어 서비스를 지원한다. 제미나이 앱에서 해당 언어를 사용하는 18세 이상의 모든 이용자가 음악을 생성할 수 있으며, 향후 더 많은 언어로 지원 범위를 늘릴 예정이다.
구글은 리리아 3가 이전 모델에 비해 특히 △자동 가사 생성 △스타일·보컬·템포 등 세부적인 요소의 정교한 제어 △품질 향상 등 오디오 생성 기능을 크게 개선했다고 설명했다.
리리아 3에 좀 더 복잡한 요청을 해 봤다. K팝 트랙을 선택하고 BTS의 곡 'DNA'와 유사한 분위기, 남성 목소리, 강렬한 신디사이저, 한국어 가사 등 조건을 첨부한 결과 음악은 몇 초 내로 빠르게 제작됐지만 일부 조건이 누락됐다. 2026.03.13.© 뉴스1 신은빈 기자 (제미나이 내 '리리아 3' 실행 화면 갈무리)
다만 세부 조정은 꽤 필요했다. 이전과는 달리 좀 더 복잡하고 구체적인 프롬프트를 입력하자 지시가 제대로 반영되지 않은 부분들이 발견됐다.
'K팝' 트랙을 선택하고 "퇴근길에 신나게 듣기 좋은 댄스곡, 방탄소년단(BTS)의 'DNA'와 비슷한 스타일이되 가사는 전부 한국어로 만들고 남성 목소리와 강렬한 신디사이저가 포함되면 좋겠다"고 입력하자 음악 자체는 몇 초 안에 빠르게 나왔다.
하지만 음악을 재생해 보니 남성 보컬 위로 여성 코러스가 깔려 있었고, 한국어와 영어 가사가 혼용되고 있었다. BTS의 곡과 분위기를 비슷하게 만들어 달라는 요청에는 "특정 아티스트의 곡을 직접적으로 모방하기보다 해당 스타일에서 느껴지는 특유의 에너지를 담아 제작했다"고 설명했다.
구글은 리리아 3가 기존 아티스트를 모방하기보다 독창적인 표현을 도울 수 있도록 설계했다고 설명했다. 지금처럼 프롬프트에 특정 아티스트 이름이 포함되면 광범위한 창의적 영감 수준으로만 참고해 유사한 분위기의 음악을 생성한다. 결과물은 기존 콘텐츠와 대조해 확인하는 필터도 운영한다.
음악 생성 AI로 잘 알려진 '수노'(Suno)와 비교했을 때는 접근성 측면에서도 강점이 있었다.
음악 분위기를 텍스트로 설명하거나 트랙 스타일을 선택하는 방식은 비슷했지만, 리리아 3는 제미나이 앱 이용자라면 챗봇을 이용하다가 모드만 바꿔서 음악을 만들 수 있어 간편했다.
수노는 텍스트를 입력해야 음악을 만들 수 있지만, 리리아 3는 사진이나 영상만 올려도 작사·작곡을 한 번에 끝낼 수 있다는 점도 차별점이다.
하지만 짧은 분량의 음악만 생성되는 부분은 한계다. 수노는 무료 버전에서는 최대 1분, 유료 버전인 프로와 프리미엄 모델로는 최대 8분 분량의 음악을 만들 수 있지만 리리아 3는 30초 남짓 음악만 생성된다. 가사를 요청해도 가사가 포함되는 부분은 그보다 짧았다.
bean@news1.kr









