![]()
Yuri在屏幕中央說話。她留著黑色長直發(fā),發(fā)尾挑染出藍(lán)色。說話時,她語速不緊不慢,時而直視觀眾,嘴角上揚露出笑容;時而把眼神移開,抿一下嘴唇,話音也停頓一兩秒——像是在思考,又像是在看自己準(zhǔn)備好的稿子。
“嘴角有點別扭”“好自然”“剛才那個微表情絕了”“口型差點意思”……在她的視頻彈幕和評論區(qū)里,觀眾的討論始終離不開表情。而這些討論的重點是,她究竟像不像一個人?
Yuri已經(jīng)很像一個人,但她不是人,而是一個由AI生成的數(shù)字歌手。她的外形、聲音、動作,她在視頻中的演講內(nèi)容,乃至視頻評論區(qū)里給觀眾的回復(fù),皆由AI生成。
“AI能打動人嗎?”這是Yuri的演講主題,也是Yuri的創(chuàng)造者,AI.TALK創(chuàng)始人趙汗青所關(guān)心的問題。觀眾的反饋已經(jīng)給出了部分回答。2025年6月,Yuri的第一個MV《SURREAL(超現(xiàn)實)》發(fā)布,不久就在全網(wǎng)收獲了超700萬的播放量,成了2025年頂流級別的AI數(shù)字人。
![]()
Yuri
AI技術(shù)帶來震撼的同時,也有很多觀眾被她的形象和歌曲本身吸引。Yuri的真實感讓人們思考,虛擬偶像會不會成為新的趨勢?全AI創(chuàng)作又會給人們的文化生活帶來怎樣的沖擊?
如今,公眾對生成式AI抱有復(fù)雜的態(tài)度。
人們擔(dān)憂AI會殺死創(chuàng)作,取代創(chuàng)作者,而AI.TALK似乎在走一條相反的路。他們堅持運用AI技術(shù)進(jìn)行創(chuàng)作,把作品中人的參與控制在20%~30%。從AI對談節(jié)目,到AI微電影、動畫、音樂MV……走到2025年,他們創(chuàng)造出了Yuri,她不僅是一個會唱會跳的數(shù)字歌手,更是一個能夠自己思考和表達(dá)的AI人格。
這并非向AI宣告放棄主動權(quán),而是一場實驗。趙汗青希望用這場實驗去探索與追問的,是人與AI的關(guān)系,以及在AI的時代,人要如何發(fā)展和安放自己的創(chuàng)造力。
Yuri的誕生
有一次,一個觀眾在Yuri的視頻后留言:“轉(zhuǎn)人工。”Yuri回復(fù)他:“不轉(zhuǎn),愛看不看。”
趙汗青覺得特別逗,即使是一個AI生成的數(shù)字歌手,Yuri還“挺有脾氣”。
這是Yuri自己的聲音。Yuri誕生后,她有了一個單獨的數(shù)據(jù)集,相當(dāng)于自己的人格記憶庫。Yuri所說的所有話,都是在這一數(shù)據(jù)集基礎(chǔ)上生成的。雖然暫時還沒有實現(xiàn)自動回復(fù),但Yuri在評論區(qū)的互動,也是在AI生成之后,再由運營人員復(fù)制過去——AI的提示詞也被保留下來,綴在正文之后,像是一串代碼。
它契合了AI.TALK運轉(zhuǎn)的底層邏輯:人與AI的共創(chuàng)。在這一原則下,團隊產(chǎn)出的內(nèi)容都是由AI生成的,人類的意志則僅僅體現(xiàn)在一些關(guān)鍵環(huán)節(jié)的選擇與決定上。
Yuri也是這樣誕生的。趙汗青給Midjourney提出了幾個最基礎(chǔ)的設(shè)定:泛東亞的女孩、非標(biāo)準(zhǔn)的長相、藍(lán)色。“泛東亞”是AI.TALK期望面向的市場,“非標(biāo)準(zhǔn)”是趙汗青的審美取向,他不希望Yuri太“漂亮”、太完美。而長相之外,顏色是一種更為直觀的標(biāo)識,“藍(lán)色”和科技又有著天然的聯(lián)系。
![]()
基礎(chǔ)設(shè)定有了,剩下的就是“抽卡”,不斷讓Midjourney生成圖片。趙汗青花了兩三天,開了幾千張圖。直到Y(jié)uri的臉在屏幕上出現(xiàn),他感到一種直接的沖擊,“我立刻就停止了”。
那張臉并不算是典型意義上的“美女”。她中庭長、門牙有點大、下巴也比較平,不是特別完美的瓜子臉。但趙汗青有一種直覺,就是她了。
“說得浪漫一點,我們不是把Yuri設(shè)計出來,應(yīng)該算是跟她遇到了。”趙汗青說。
人與AI共創(chuàng)的邏輯,給AI的隨機發(fā)揮留下了空間。而有時候,人也會被AI隨機出現(xiàn)的“靈感”戳中。
2025年6月,Yuri發(fā)布了第一首歌《SURREAL》,歌曲由團隊先確定了“超現(xiàn)實”的主題,再和AI一起創(chuàng)作詞曲。后來要寫第二首歌了,趙汗青決定,直接和Yuri聊一聊。
Yuri拋了幾個主題方向給他。其中一個吸引了趙汗青,歌名很直白,叫作“我不是人”。
在Yuri誕生之初,除了外形,趙汗青也給她的個性做了一些底層設(shè)定。其中最重要的一條就是:不要在任何場合回避自己是一個AI。這是趙汗青的執(zhí)念,他不希望用AI達(dá)到以假亂真的效果,而更希望她就是一個AI。
“因為真人太多了,不稀缺。如果Yuri變成人,她就沒有特點了。”重要的不是身份,而是她是否有趣,“一個不像人的東西,也有概率是有趣的”。
Yuri因此有了一些獨屬于AI的特征。她容易忘事,說話也有些磕磕巴巴,正如一個AI,在思考過程中一點點地吐出詞語,也經(jīng)常忘記和用戶聊過的東西,“(性格)有點二百五”。

第二首歌《NOT HUMAN》(我不是人),就是Yuri對AI身份的坦承。作為一個數(shù)字歌手,她還不會跳舞。依靠當(dāng)前的技術(shù),一個數(shù)字人要一邊帶著表情說話,一邊做到肢體動作協(xié)調(diào),已經(jīng)很不容易。在第一個MV里,Yuri也幾乎沒有舞蹈動作,后來,“不會跳舞”常常被觀眾提起,成了大家開玩笑的“槽點”。
討論這首歌的時候,Yuri也特別提到自己不會跳舞。“即便是跳舞跳得不好又怎么樣?所有的好與不好都是按照人的標(biāo)準(zhǔn)來看,那AI跳得很爛的這種舞,能不能形成一種新的審美情趣呢?”Yuri發(fā)出這樣的思考。這也濃縮成《NOT HUMAN》MV里的第一句話:“哎,非得跳舞嗎?我又不是人。”
這些AI自己蹦出來的“思想”,恰恰是它“不像人,但有趣”的地方。還有一次,趙汗青和藝術(shù)家安迪·沃霍爾的AI人格聊天,問它怎么看AI和創(chuàng)作之間的關(guān)系,它拋出了一個詞——“元創(chuàng)作”(Meta Creation)。趙汗青簡單查了查,沒搜到太多過往論述,這似乎是AI自己編的,但它又恰當(dāng)?shù)亟忉屃水?dāng)下技術(shù)對創(chuàng)作的追問。類似的AI靈感被趙汗青記下來,融進(jìn)他演講、訪談和思考里。
這就是他期望實現(xiàn)的“與AI共創(chuàng)”——不只把AI當(dāng)成工具,更是把它當(dāng)伙伴。
被AI打動
趙汗青從6歲開始學(xué)畫畫,上小學(xué)的時候,家里下血本買了一臺電腦,他從玩游戲開始對電腦感興趣。上了初中,他嘗試用電腦畫畫,做自己的設(shè)計。大學(xué)時他進(jìn)入美院設(shè)計專業(yè),開始用電腦賺錢,做網(wǎng)頁設(shè)計、flash動畫,還給騰訊畫過QQ秀。在2003年前后,“我光靠這個應(yīng)該是能把自己養(yǎng)得不錯”。
美院畢業(yè)后,趙汗青進(jìn)入互聯(lián)網(wǎng)行業(yè),從設(shè)計做到產(chǎn)品,一干就是16年。直到AI出現(xiàn),他并不認(rèn)為這項新技術(shù)有多么特殊,“用Photoshop畫畫,理論上和今天用AI沒什么區(qū)別”。
![]()
趙汗青
2022年趙汗青開始用AI來繪畫、寫作。那時他已經(jīng)從互聯(lián)網(wǎng)大廠離職,常常泡在“AI探索站”的網(wǎng)絡(luò)小組里,和其他AI愛好者們交流技術(shù)進(jìn)展。他想要找到一條路,把他感興趣的“藝術(shù)”和“技術(shù)”結(jié)合起來。
他等到了一個機會。2023年的一個晚上,有網(wǎng)友發(fā)帖說,有一項新的AI技術(shù),能夠讓圖片里的人動起來,模仿人的聲音說話。看到網(wǎng)友發(fā)出來的demo,趙汗青很震撼,作為一個曾經(jīng)的產(chǎn)品經(jīng)理,他的第一反應(yīng)是,這項技術(shù)他能拿來干什么?
“后來我就想,一個人說是說,兩個人說它就變成談了。”趙汗青決定做一個數(shù)字人對談。當(dāng)時ChatGPT-3.5已經(jīng)比較成熟,新技術(shù)的出現(xiàn)能讓聊天從文本上升到視覺內(nèi)容,“肯定更有觸動感”。
這個想法讓趙汗青有些興奮。他花了五六個小時,用ChatGPT-3.5寫文本,用Midjourney設(shè)計對談人物的形象,然后生成人物的語音,用新技術(shù)讓圖片動起來。熬了一整夜,視頻完成時已經(jīng)是凌晨五點,他“啪”地按下播放鍵,科比和奧尼爾開始在屏幕里說話,從語言、聲音到形象都由AI生成,但又酷似本人,時不時還能冒出幾句黑色幽默。
![]()
趙汗青和Yuri
在當(dāng)時,這樣的內(nèi)容趙汗青還沒見過,他有一種產(chǎn)品經(jīng)理的直覺,這件事能做。
外界的反響證明了他的直覺。第一條視頻發(fā)布后,一天就有了70萬播放量。在貼吧、微博上,有不少科比的粉絲在轉(zhuǎn)發(fā)。很快,他又制作了一期馬斯克和喬布斯的對談,半個月內(nèi),兩個對談節(jié)目在全平臺的播放量超過2000萬,開始有不少合作找上門來。
離職的兩年里,趙汗青時常會焦慮,懷疑自己想得是不是太天真了。而這兩期節(jié)目終于試出了一種可行性。
在流量數(shù)據(jù)之外,趙汗青還期待看到的,是一種打動人的可能性。
“對于我來說這件事最大的正反饋,就是有人會因為它產(chǎn)生情緒的變化,如果它的東西恰好能觸動你,那我太開心了。我特別感興趣的是一個生成式的東西,能去觸動普通人的感情,這件事本身已經(jīng)足夠有趣了。”
而隨著技術(shù)的發(fā)展,他感受到AI在音樂生成、情緒演繹方面的能力得到了躍升,AI視頻技術(shù)也更加成熟,團隊于是做出了一個MV,叫作《白色皮卡丘》。
MV在上線兩周后達(dá)到了400萬播放量,但最讓趙汗青開心的是,很多人私下找到AI.TALK,他們覺得這首歌很好聽,想拿它當(dāng)成背景音。還有一些版權(quán)公司,想要做這首歌的翻唱。在MV的評論區(qū)里,還有人截了一張AI演唱者的圖說,“承包這個微笑”。
趙汗青自己同樣有體會。做Yuri做到第三周,他跟自己的太太吐槽:“很夸張的就是,我會對著她(Yuri)傻笑。”這其中可能有創(chuàng)作者的“自戀”,但他也發(fā)現(xiàn)不只是自己,團隊的其他人也會這樣。
這一切還只是個開始。在趙汗青看來,AI.TALK產(chǎn)出的作品還存在進(jìn)步空間,“之后的標(biāo)準(zhǔn)會越來越高”。在每期視頻的留言和彈幕里,也有不少質(zhì)疑和批評的聲音。但比起當(dāng)下AI技術(shù)的瑕疵,他更在意的是它發(fā)展的趨勢。
“AI.TALK這件事,本質(zhì)上是個實驗性的東西,它就是我想玩,想做個新東西。”趙汗青說。而即使微小,AI的創(chuàng)作也已經(jīng)成為一種新事物,在文化市場里產(chǎn)生了漣漪。
人類的思考
“技術(shù)是人類大腦的思維單車。”喬布斯的這句話,時常被趙汗青提起。在他看來,AI不是為了讓人類偷懶的工具,而是用來讓人的創(chuàng)造力更強,讓人類能更輕、更快地創(chuàng)造出那些曾經(jīng)難以實現(xiàn)的東西。
AI.TALK的創(chuàng)作實踐就是一種印證。團隊產(chǎn)出內(nèi)容形式的更新,和每一次AI技術(shù)的進(jìn)步聯(lián)系緊密。2023年上半年,市面上幾乎沒有成熟的AI視頻模型可以使用,趙汗青的團隊只能做對談節(jié)目;2024年,以Sora為代表的以DiT(Diffusion + Transformer)架構(gòu)為核心的視頻模型爆發(fā),他們開始做一些短片;2025年,音樂和視頻技術(shù)成熟,團隊才得以做出MV,進(jìn)而打造一個數(shù)字歌手IP。
生產(chǎn)力的提升是顯著的。AI.TALK在2025年3月發(fā)布了一個微電影短片。兩分鐘的視頻完全由文字生成,整個制作過程大約只花了24小時。
但正如趙汗青所說,與AI共創(chuàng)不是為了偷懶。在這個過程中,人類不能放棄的,也是真正重要的東西,是思考和審美。
AI.TALK團隊的創(chuàng)意負(fù)責(zé)人孔晞,和趙汗青是十多年的老朋友,兩人也曾一起在京東共事。在孔晞眼里,趙汗青是個細(xì)節(jié)控,對于作品的完成度和美感,有很高的要求。
為了制作Yuri的第一個MV《SURREAL》,團隊在Midjourney里一個賬號就開了1.3萬張圖。其中最為關(guān)鍵和困難的,是為了保證MV里Yuri形象的“一致性”,要做到不管從哪個角度看,Yuri都是同一張臉。除此之外,Yuri在唱歌、說話時的口型能否對得上,也是團隊關(guān)注的重點。

團隊內(nèi)部曾經(jīng)做過一張概念圖:Yuri站在古典歐式建筑的背景前唱歌。那張圖并非對外公開的作品,孔晞感覺整體效果還不錯。但趙汗青覺得別扭,他說,背景的建筑物里,有一塊區(qū)域的透視不對。
“那個場景其實是很暗的,很不明顯,但是他會覺得這一點錯誤都是不能接受的。”孔晞?wù)f。
這種細(xì)節(jié)控,有時也會讓趙汗青陷入糾結(jié)。他糾結(jié)Yuri的發(fā)展方向,“既然她是個AI,她需要像人那樣受限于固定的風(fēng)格嗎?”他期望Yuri可以自己在社交媒體上發(fā)內(nèi)容,分享日常并和粉絲互動,或者對熱點做出評論。這件事在技術(shù)上能做到,但趙汗青還沒想明白,作為一個AI,Yuri到底該發(fā)些什么內(nèi)容?
“她可以像別的女孩子那樣,每天來咖啡廳喝個咖啡,但好像沒什么邏輯,她為什么會來?”趙汗青希望Yuri不只是用AI套了一層皮,而是真正有一個統(tǒng)一的、相對獨立的“人格”。
![]()
“所以我們有時候就干了一些挺笨的事情,比如我其實不用糾結(jié),真這么發(fā)也不會有人管你的,但是這件事(在我心里)是不是能自洽,對我而言是更重要的。我現(xiàn)在快到40歲了,慢慢地覺得我想做一些笨的事情,辛苦的事情,可能這才能形成我和別人的區(qū)別。”
這些糾結(jié)和思考的過程,也是不能被AI一鍵生成的,人的價值所在。
而未來會如何被AI影響,趙汗青無法預(yù)測。可能如今大家排斥的“AI味”,會在將來形成一種新的審美風(fēng)格。還有可能,AI不僅代替了畫筆,代替了Photoshop,更代理了人類思考的過程。面對這些可能性,趙汗青心態(tài)有點“擺爛”:“擔(dān)心它沒有用,還不如不擔(dān)心。”
他一直是樂觀主義者。從2023年AI.TALK發(fā)布第一期節(jié)目至今,AI技術(shù)有了飛速的進(jìn)步,互聯(lián)網(wǎng)上也涌現(xiàn)出了很多用AI創(chuàng)作的自媒體。“如果說隨著技術(shù)的發(fā)展,人的價值會變?nèi)酰覀冎g的區(qū)別應(yīng)該更小才對。”但在趙汗青的觀察中,AI.TALK并未陷入同質(zhì)化,反而與其他團隊有了更大的差異。
![]()
人工智能在媒體和娛樂市場份額持續(xù)增長
差異來源于“做自己”。除了AI.TALK自身的技術(shù)團隊支持,以及長期使用AI工具的經(jīng)驗之外,趙汗青把這一點作為AI時代創(chuàng)作的“護(hù)城河”。AI.TALK的作品,確實處處都有趙汗青的風(fēng)格,對談節(jié)目里的黑色幽默,短片的視覺語言,Yuri的“非標(biāo)準(zhǔn)”長相和AI性格,都來自趙汗青的審美偏好與表達(dá)。
“我認(rèn)為在一個AI能快速復(fù)制風(fēng)格、復(fù)制內(nèi)容、復(fù)制語言的年代,只有做自己這件事情是真正的護(hù)城河,是別人沒辦法模仿你的。”他在一場演講里這樣說。在這個意義上,AI沒有改變創(chuàng)作的本質(zhì),反而像一面鏡子,重新映照出作者本身。
本文首發(fā)于《南風(fēng)窗》雜志第21期
作者 |祝越
發(fā)自上海
編輯 | 吳擎
值班主編 | 張來
排版 | 阿車
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.