Google宣布,其聊天機器人應用 Gemini 現(xiàn)已集成由 DeepMind 開發(fā)的最新音頻模型 Lyria 3,用戶可以直接在對話界面中生成時長約 30 秒的 AI 音樂作品。 這一功能目前以測試版本形式推出,支持基于文本、圖片和視頻等多種輸入生成音樂,無需跳轉(zhuǎn)至其他工具或平臺。
![]()
據(jù)介紹,新工具首先在全球范圍內(nèi)向部分用戶開放,支持英語、德語、西班牙語、法語、印地語、日語、韓語和葡語等多種語言,后續(xù)還將進一步擴展支持范圍。 使用門檻方面,只有年滿 18 歲的 Gemini 應用用戶才可以體驗這項音樂生成功能。
在使用方式上,Lyria 3 提供了較為豐富的“文本生成音樂”能力,用戶可以通過描述具體的曲風、情緒或場景來定制一段音樂。比如輸入“給媽媽的一首 Afrobeat 曲風歌曲,歌里面寫我們一起長大的美好回憶”等指令,系統(tǒng)便能自動創(chuàng)作相應風格的曲目。 生成內(nèi)容既包括純伴奏音樂,也可以自動創(chuàng)作并演唱帶歌詞的歌曲。 用戶還可以上傳照片或視頻,Gemini 會根據(jù)畫面氛圍生成匹配情緒和主題的帶詞音樂作品。
Google官方表示,這一工具的設(shè)計初衷并非為了創(chuàng)作“音樂杰作”,而是為用戶提供一種“有趣且個性化的自我表達方式”。 在作品呈現(xiàn)形式上,Gemini 會為在應用內(nèi)創(chuàng)作的歌曲自動生成由 Nano Banana 模型制作的封面圖,方便用戶下載或分享音樂內(nèi)容。 同時,Google還將 Lyria 3 擴展到 YouTube 的 Dream Track 功能中,創(chuàng)作者可以用它為 Shorts 短視頻生成定制化的 AI 背景音樂。
值得注意的是,Lyria 與 Dream Track 在早期演示階段就曾展示過模仿知名歌手嗓音與風格的能力,這也引發(fā)了外界對版權(quán)與侵權(quán)風險的關(guān)注。 Google對此強調(diào),在開發(fā) Lyria 3 的過程中對版權(quán)問題“格外謹慎”,并表示該工具的目標是支持“原創(chuàng)表達”,而不是用來“模仿現(xiàn)有藝術(shù)家”。 當用戶明確點名某位歌手時,Gemini 不會直接復刻其聲線,而是生成“在風格或情緒上相似”的曲目,并通過過濾機制將生成結(jié)果與現(xiàn)有內(nèi)容進行比對,以減少潛在侵權(quán)風險。
Lyria 系列模型最早于 2023 年亮相,此前主要通過 Google Cloud 上的 Vertex 平臺面向企業(yè)和開發(fā)者開放,普通用戶接觸機會有限。 隨著此次集成進 Gemini 應用,這一 AI 音樂工具的使用門檻顯著降低,更多消費者可以直接上手體驗生成式音樂創(chuàng)作。 不過,相比 TikTok 和微軟 Copilot 等平臺早已推出自家的 AI 音樂生成功能,Google在直接面向大眾用戶的應用落地上明顯略晚一步。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.