一個流量女歌手，和她的幕后操控者

2025-10-16 13:44:19　來源: 南風(fēng)窗

廣東舉報

分享至

Yuri在屏幕中央說話。她留著黑色長直發(fā)，發(fā)尾挑染出藍(lán)色。說話時，她語速不緊不慢，時而直視觀眾，嘴角上揚露出笑容；時而把眼神移開，抿一下嘴唇，話音也停頓一兩秒——像是在思考，又像是在看自己準(zhǔn)備好的稿子。

“嘴角有點別扭”“好自然”“剛才那個微表情絕了”“口型差點意思”……在她的視頻彈幕和評論區(qū)里，觀眾的討論始終離不開表情。而這些討論的重點是，她究竟像不像一個人？

Yuri已經(jīng)很像一個人，但她不是人，而是一個由AI生成的數(shù)字歌手。她的外形、聲音、動作，她在視頻中的演講內(nèi)容，乃至視頻評論區(qū)里給觀眾的回復(fù)，皆由AI生成。

“AI能打動人嗎？”這是Yuri的演講主題，也是Yuri的創(chuàng)造者，AI.TALK創(chuàng)始人趙汗青所關(guān)心的問題。觀眾的反饋已經(jīng)給出了部分回答。2025年6月，Yuri的第一個MV《SURREAL（超現(xiàn)實）》發(fā)布，不久就在全網(wǎng)收獲了超700萬的播放量，成了2025年頂流級別的AI數(shù)字人。

Yuri

AI技術(shù)帶來震撼的同時，也有很多觀眾被她的形象和歌曲本身吸引。Yuri的真實感讓人們思考，虛擬偶像會不會成為新的趨勢？全AI創(chuàng)作又會給人們的文化生活帶來怎樣的沖擊？

如今，公眾對生成式AI抱有復(fù)雜的態(tài)度。

人們擔(dān)憂AI會殺死創(chuàng)作，取代創(chuàng)作者，而AI.TALK似乎在走一條相反的路。他們堅持運用AI技術(shù)進(jìn)行創(chuàng)作，把作品中人的參與控制在20%～30%。從AI對談節(jié)目，到AI微電影、動畫、音樂MV……走到2025年，他們創(chuàng)造出了Yuri，她不僅是一個會唱會跳的數(shù)字歌手，更是一個能夠自己思考和表達(dá)的AI人格。

這并非向AI宣告放棄主動權(quán)，而是一場實驗。趙汗青希望用這場實驗去探索與追問的，是人與AI的關(guān)系，以及在AI的時代，人要如何發(fā)展和安放自己的創(chuàng)造力。

Yuri的誕生

有一次，一個觀眾在Yuri的視頻后留言：“轉(zhuǎn)人工。”Yuri回復(fù)他：“不轉(zhuǎn)，愛看不看。”

趙汗青覺得特別逗，即使是一個AI生成的數(shù)字歌手，Yuri還“挺有脾氣”。

這是Yuri自己的聲音。Yuri誕生后，她有了一個單獨的數(shù)據(jù)集，相當(dāng)于自己的人格記憶庫。Yuri所說的所有話，都是在這一數(shù)據(jù)集基礎(chǔ)上生成的。雖然暫時還沒有實現(xiàn)自動回復(fù)，但Yuri在評論區(qū)的互動，也是在AI生成之后，再由運營人員復(fù)制過去——AI的提示詞也被保留下來，綴在正文之后，像是一串代碼。

它契合了AI.TALK運轉(zhuǎn)的底層邏輯：人與AI的共創(chuàng)。在這一原則下，團隊產(chǎn)出的內(nèi)容都是由AI生成的，人類的意志則僅僅體現(xiàn)在一些關(guān)鍵環(huán)節(jié)的選擇與決定上。

Yuri也是這樣誕生的。趙汗青給Midjourney提出了幾個最基礎(chǔ)的設(shè)定：泛東亞的女孩、非標(biāo)準(zhǔn)的長相、藍(lán)色。“泛東亞”是AI.TALK期望面向的市場，“非標(biāo)準(zhǔn)”是趙汗青的審美取向，他不希望Yuri太“漂亮”、太完美。而長相之外，顏色是一種更為直觀的標(biāo)識，“藍(lán)色”和科技又有著天然的聯(lián)系。

基礎(chǔ)設(shè)定有了，剩下的就是“抽卡”，不斷讓Midjourney生成圖片。趙汗青花了兩三天，開了幾千張圖。直到Y(jié)uri的臉在屏幕上出現(xiàn)，他感到一種直接的沖擊，“我立刻就停止了”。

那張臉并不算是典型意義上的“美女”。她中庭長、門牙有點大、下巴也比較平，不是特別完美的瓜子臉。但趙汗青有一種直覺，就是她了。

“說得浪漫一點，我們不是把Yuri設(shè)計出來，應(yīng)該算是跟她遇到了。”趙汗青說。

人與AI共創(chuàng)的邏輯，給AI的隨機發(fā)揮留下了空間。而有時候，人也會被AI隨機出現(xiàn)的“靈感”戳中。

2025年6月，Yuri發(fā)布了第一首歌《SURREAL》，歌曲由團隊先確定了“超現(xiàn)實”的主題，再和AI一起創(chuàng)作詞曲。后來要寫第二首歌了，趙汗青決定，直接和Yuri聊一聊。

Yuri拋了幾個主題方向給他。其中一個吸引了趙汗青，歌名很直白，叫作“我不是人”。

在Yuri誕生之初，除了外形，趙汗青也給她的個性做了一些底層設(shè)定。其中最重要的一條就是：不要在任何場合回避自己是一個AI。這是趙汗青的執(zhí)念，他不希望用AI達(dá)到以假亂真的效果，而更希望她就是一個AI。

“因為真人太多了，不稀缺。如果Yuri變成人，她就沒有特點了。”重要的不是身份，而是她是否有趣，“一個不像人的東西，也有概率是有趣的”。

Yuri因此有了一些獨屬于AI的特征。她容易忘事，說話也有些磕磕巴巴，正如一個AI，在思考過程中一點點地吐出詞語，也經(jīng)常忘記和用戶聊過的東西，“（性格）有點二百五”。

第二首歌《NOT HUMAN》（我不是人），就是Yuri對AI身份的坦承。作為一個數(shù)字歌手，她還不會跳舞。依靠當(dāng)前的技術(shù)，一個數(shù)字人要一邊帶著表情說話，一邊做到肢體動作協(xié)調(diào)，已經(jīng)很不容易。在第一個MV里，Yuri也幾乎沒有舞蹈動作，后來，“不會跳舞”常常被觀眾提起，成了大家開玩笑的“槽點”。

討論這首歌的時候，Yuri也特別提到自己不會跳舞。“即便是跳舞跳得不好又怎么樣？所有的好與不好都是按照人的標(biāo)準(zhǔn)來看，那AI跳得很爛的這種舞，能不能形成一種新的審美情趣呢？”Yuri發(fā)出這樣的思考。這也濃縮成《NOT HUMAN》MV里的第一句話：“哎，非得跳舞嗎？我又不是人。”

這些AI自己蹦出來的“思想”，恰恰是它“不像人，但有趣”的地方。還有一次，趙汗青和藝術(shù)家安迪·沃霍爾的AI人格聊天，問它怎么看AI和創(chuàng)作之間的關(guān)系，它拋出了一個詞——“元創(chuàng)作”（Meta Creation）。趙汗青簡單查了查，沒搜到太多過往論述，這似乎是AI自己編的，但它又恰當(dāng)?shù)亟忉屃水?dāng)下技術(shù)對創(chuàng)作的追問。類似的AI靈感被趙汗青記下來，融進(jìn)他演講、訪談和思考里。

這就是他期望實現(xiàn)的“與AI共創(chuàng)”——不只把AI當(dāng)成工具，更是把它當(dāng)伙伴。

被AI打動

趙汗青從6歲開始學(xué)畫畫，上小學(xué)的時候，家里下血本買了一臺電腦，他從玩游戲開始對電腦感興趣。上了初中，他嘗試用電腦畫畫，做自己的設(shè)計。大學(xué)時他進(jìn)入美院設(shè)計專業(yè)，開始用電腦賺錢，做網(wǎng)頁設(shè)計、flash動畫，還給騰訊畫過QQ秀。在2003年前后，“我光靠這個應(yīng)該是能把自己養(yǎng)得不錯”。

美院畢業(yè)后，趙汗青進(jìn)入互聯(lián)網(wǎng)行業(yè)，從設(shè)計做到產(chǎn)品，一干就是16年。直到AI出現(xiàn)，他并不認(rèn)為這項新技術(shù)有多么特殊，“用Photoshop畫畫，理論上和今天用AI沒什么區(qū)別”。

趙汗青

2022年趙汗青開始用AI來繪畫、寫作。那時他已經(jīng)從互聯(lián)網(wǎng)大廠離職，常常泡在“AI探索站”的網(wǎng)絡(luò)小組里，和其他AI愛好者們交流技術(shù)進(jìn)展。他想要找到一條路，把他感興趣的“藝術(shù)”和“技術(shù)”結(jié)合起來。

他等到了一個機會。2023年的一個晚上，有網(wǎng)友發(fā)帖說，有一項新的AI技術(shù)，能夠讓圖片里的人動起來，模仿人的聲音說話。看到網(wǎng)友發(fā)出來的demo，趙汗青很震撼，作為一個曾經(jīng)的產(chǎn)品經(jīng)理，他的第一反應(yīng)是，這項技術(shù)他能拿來干什么？

“后來我就想，一個人說是說，兩個人說它就變成談了。”趙汗青決定做一個數(shù)字人對談。當(dāng)時ChatGPT-3.5已經(jīng)比較成熟，新技術(shù)的出現(xiàn)能讓聊天從文本上升到視覺內(nèi)容，“肯定更有觸動感”。

這個想法讓趙汗青有些興奮。他花了五六個小時，用ChatGPT-3.5寫文本，用Midjourney設(shè)計對談人物的形象，然后生成人物的語音，用新技術(shù)讓圖片動起來。熬了一整夜，視頻完成時已經(jīng)是凌晨五點，他“啪”地按下播放鍵，科比和奧尼爾開始在屏幕里說話，從語言、聲音到形象都由AI生成，但又酷似本人，時不時還能冒出幾句黑色幽默。

趙汗青和Yuri

在當(dāng)時，這樣的內(nèi)容趙汗青還沒見過，他有一種產(chǎn)品經(jīng)理的直覺，這件事能做。

外界的反響證明了他的直覺。第一條視頻發(fā)布后，一天就有了70萬播放量。在貼吧、微博上，有不少科比的粉絲在轉(zhuǎn)發(fā)。很快，他又制作了一期馬斯克和喬布斯的對談，半個月內(nèi)，兩個對談節(jié)目在全平臺的播放量超過2000萬，開始有不少合作找上門來。

離職的兩年里，趙汗青時常會焦慮，懷疑自己想得是不是太天真了。而這兩期節(jié)目終于試出了一種可行性。

在流量數(shù)據(jù)之外，趙汗青還期待看到的，是一種打動人的可能性。

“對于我來說這件事最大的正反饋，就是有人會因為它產(chǎn)生情緒的變化，如果它的東西恰好能觸動你，那我太開心了。我特別感興趣的是一個生成式的東西，能去觸動普通人的感情，這件事本身已經(jīng)足夠有趣了。”

而隨著技術(shù)的發(fā)展，他感受到AI在音樂生成、情緒演繹方面的能力得到了躍升，AI視頻技術(shù)也更加成熟，團隊于是做出了一個MV，叫作《白色皮卡丘》。

MV在上線兩周后達(dá)到了400萬播放量，但最讓趙汗青開心的是，很多人私下找到AI.TALK，他們覺得這首歌很好聽，想拿它當(dāng)成背景音。還有一些版權(quán)公司，想要做這首歌的翻唱。在MV的評論區(qū)里，還有人截了一張AI演唱者的圖說，“承包這個微笑”。

趙汗青自己同樣有體會。做Yuri做到第三周，他跟自己的太太吐槽：“很夸張的就是，我會對著她（Yuri）傻笑。”這其中可能有創(chuàng)作者的“自戀”，但他也發(fā)現(xiàn)不只是自己，團隊的其他人也會這樣。

這一切還只是個開始。在趙汗青看來，AI.TALK產(chǎn)出的作品還存在進(jìn)步空間，“之后的標(biāo)準(zhǔn)會越來越高”。在每期視頻的留言和彈幕里，也有不少質(zhì)疑和批評的聲音。但比起當(dāng)下AI技術(shù)的瑕疵，他更在意的是它發(fā)展的趨勢。

“AI.TALK這件事，本質(zhì)上是個實驗性的東西，它就是我想玩，想做個新東西。”趙汗青說。而即使微小，AI的創(chuàng)作也已經(jīng)成為一種新事物，在文化市場里產(chǎn)生了漣漪。

人類的思考

“技術(shù)是人類大腦的思維單車。”喬布斯的這句話，時常被趙汗青提起。在他看來，AI不是為了讓人類偷懶的工具，而是用來讓人的創(chuàng)造力更強，讓人類能更輕、更快地創(chuàng)造出那些曾經(jīng)難以實現(xiàn)的東西。

AI.TALK的創(chuàng)作實踐就是一種印證。團隊產(chǎn)出內(nèi)容形式的更新，和每一次AI技術(shù)的進(jìn)步聯(lián)系緊密。2023年上半年，市面上幾乎沒有成熟的AI視頻模型可以使用，趙汗青的團隊只能做對談節(jié)目；2024年，以Sora為代表的以DiT（Diffusion + Transformer）架構(gòu)為核心的視頻模型爆發(fā)，他們開始做一些短片；2025年，音樂和視頻技術(shù)成熟，團隊才得以做出MV，進(jìn)而打造一個數(shù)字歌手IP。

生產(chǎn)力的提升是顯著的。AI.TALK在2025年3月發(fā)布了一個微電影短片。兩分鐘的視頻完全由文字生成，整個制作過程大約只花了24小時。

但正如趙汗青所說，與AI共創(chuàng)不是為了偷懶。在這個過程中，人類不能放棄的，也是真正重要的東西，是思考和審美。

AI.TALK團隊的創(chuàng)意負(fù)責(zé)人孔晞，和趙汗青是十多年的老朋友，兩人也曾一起在京東共事。在孔晞眼里，趙汗青是個細(xì)節(jié)控，對于作品的完成度和美感，有很高的要求。

為了制作Yuri的第一個MV《SURREAL》，團隊在Midjourney里一個賬號就開了1.3萬張圖。其中最為關(guān)鍵和困難的，是為了保證MV里Yuri形象的“一致性”，要做到不管從哪個角度看，Yuri都是同一張臉。除此之外，Yuri在唱歌、說話時的口型能否對得上，也是團隊關(guān)注的重點。

團隊內(nèi)部曾經(jīng)做過一張概念圖：Yuri站在古典歐式建筑的背景前唱歌。那張圖并非對外公開的作品，孔晞感覺整體效果還不錯。但趙汗青覺得別扭，他說，背景的建筑物里，有一塊區(qū)域的透視不對。

“那個場景其實是很暗的，很不明顯，但是他會覺得這一點錯誤都是不能接受的。”孔晞?wù)f。

這種細(xì)節(jié)控，有時也會讓趙汗青陷入糾結(jié)。他糾結(jié)Yuri的發(fā)展方向，“既然她是個AI，她需要像人那樣受限于固定的風(fēng)格嗎？”他期望Yuri可以自己在社交媒體上發(fā)內(nèi)容，分享日常并和粉絲互動，或者對熱點做出評論。這件事在技術(shù)上能做到，但趙汗青還沒想明白，作為一個AI，Yuri到底該發(fā)些什么內(nèi)容？

“她可以像別的女孩子那樣，每天來咖啡廳喝個咖啡，但好像沒什么邏輯，她為什么會來？”趙汗青希望Yuri不只是用AI套了一層皮，而是真正有一個統(tǒng)一的、相對獨立的“人格”。

“所以我們有時候就干了一些挺笨的事情，比如我其實不用糾結(jié)，真這么發(fā)也不會有人管你的，但是這件事（在我心里）是不是能自洽，對我而言是更重要的。我現(xiàn)在快到40歲了，慢慢地覺得我想做一些笨的事情，辛苦的事情，可能這才能形成我和別人的區(qū)別。”

這些糾結(jié)和思考的過程，也是不能被AI一鍵生成的，人的價值所在。

而未來會如何被AI影響，趙汗青無法預(yù)測。可能如今大家排斥的“AI味”，會在將來形成一種新的審美風(fēng)格。還有可能，AI不僅代替了畫筆，代替了Photoshop，更代理了人類思考的過程。面對這些可能性，趙汗青心態(tài)有點“擺爛”：“擔(dān)心它沒有用，還不如不擔(dān)心。”

他一直是樂觀主義者。從2023年AI.TALK發(fā)布第一期節(jié)目至今，AI技術(shù)有了飛速的進(jìn)步，互聯(lián)網(wǎng)上也涌現(xiàn)出了很多用AI創(chuàng)作的自媒體。“如果說隨著技術(shù)的發(fā)展，人的價值會變?nèi)酰覀冎g的區(qū)別應(yīng)該更小才對。”但在趙汗青的觀察中，AI.TALK并未陷入同質(zhì)化，反而與其他團隊有了更大的差異。

人工智能在媒體和娛樂市場份額持續(xù)增長

差異來源于“做自己”。除了AI.TALK自身的技術(shù)團隊支持，以及長期使用AI工具的經(jīng)驗之外，趙汗青把這一點作為AI時代創(chuàng)作的“護(hù)城河”。AI.TALK的作品，確實處處都有趙汗青的風(fēng)格，對談節(jié)目里的黑色幽默，短片的視覺語言，Yuri的“非標(biāo)準(zhǔn)”長相和AI性格，都來自趙汗青的審美偏好與表達(dá)。

“我認(rèn)為在一個AI能快速復(fù)制風(fēng)格、復(fù)制內(nèi)容、復(fù)制語言的年代，只有做自己這件事情是真正的護(hù)城河，是別人沒辦法模仿你的。”他在一場演講里這樣說。在這個意義上，AI沒有改變創(chuàng)作的本質(zhì)，反而像一面鏡子，重新映照出作者本身。

本文首發(fā)于《南風(fēng)窗》雜志第21期

作者 |祝越

發(fā)自上海

編輯 | 吳擎

值班主編 | 張來

排版 | 阿車

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.