快科技2月20日消息,據(jù)媒體報(bào)道,谷歌宣布,其Gemini應(yīng)用正式集成DeepMind旗下最先進(jìn)的音樂生成模型Lyria 3,用戶僅憑一句文字描述或一張照片,即可在數(shù)秒內(nèi)生成一段30秒的完整音樂片段。
據(jù)谷歌介紹,Lyria 3的創(chuàng)作方式靈活多樣:用戶可以"描述一個(gè)想法",比如指定某種風(fēng)格、情緒或節(jié)奏,模型便能自動(dòng)生成包含人聲、歌詞和伴奏的歌曲;也可以上傳照片或視頻,Lyria 3會(huì)分析畫面氛圍,創(chuàng)作出契合場景的配樂,并配有由Nano Banana設(shè)計(jì)的自定義封面。
此外,YouTube創(chuàng)作者還可通過Dream Track功能探索Lyria 3,為Shorts短視頻配樂,該功能已在美國推出,并逐步推廣至其他地區(qū)。
![]()
消息公布后,歐美流媒體音樂平臺(tái)Spotify股價(jià)一度回吐日內(nèi)近5%的漲幅,Sirius XM也短暫轉(zhuǎn)跌。有分析認(rèn)為,雖然Lyria 3短期內(nèi)不會(huì)對Spotify構(gòu)成致命沖擊,但可能倒逼其加快推出AI混音功能。
對于谷歌而言,將音頻生成工具融入移動(dòng)應(yīng)用,既增強(qiáng)了消費(fèi)者產(chǎn)品的競爭力,也向投資者展示了其AI投入的變現(xiàn)潛力。
若用戶提示中提及真實(shí)音樂人,Gemini只會(huì)將其視為"廣泛的創(chuàng)作靈感來源",生成風(fēng)格或氛圍相似的作品,并設(shè)有過濾器防止輸出侵權(quán)內(nèi)容。同時(shí),所有生成的曲目均使用SynthID技術(shù)添加了不易察覺的水印,便于檢測AI創(chuàng)作內(nèi)容。
生成式AI在音樂行業(yè)始終面臨謹(jǐn)慎甚至敵視的態(tài)度,許多從業(yè)者擔(dān)憂其可能威脅商業(yè)模式和知識產(chǎn)權(quán)。谷歌此次通過技術(shù)手段明確劃定邊界,試圖在創(chuàng)新與保護(hù)之間尋求平衡。
目前Lyria 3已向全球18歲以上用戶開放,支持英語、德語、西班牙語、法語、印地語、日語、韓語、葡萄牙語等語言,未來還將擴(kuò)展更多語言并提升生成質(zhì)量。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.