<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      不是,怎么有模型叫“老婆們”,還能視頻通話啊?

      0
      分享至


      “2030 年,打造出全球十億人愿意生活在其中的虛擬世界。”

      這是三年前米哈游喊出的口號(hào),世超當(dāng)初聽(tīng)著也是小小激動(dòng)了一把,但近幾年好像都沒(méi)啥動(dòng)靜了,也就覺(jué)得這不過(guò)是給咱二次元畫(huà)的餅罷了。。。


      但所謂“ 技術(shù)宅拯救世界 ”,米哈游在中二這方面從不讓人失望,前些天一個(gè)叫“LPM-1.0”的模型新鮮出爐,讓咱跟這張餅的距離又近了點(diǎn)兒。

      LPM-1.0 (Large Performance Model)即大表演模型,由人工智能公司 Anuttacon 訓(xùn)練,背后正是米哈游聯(lián)合創(chuàng)始人蔡浩宇。

      而在這次的視頻模型之前,他們還推出過(guò)二次元風(fēng)格非常濃郁的聊天模型“AnunNeko”,以及 AI 驅(qū)動(dòng)的游戲“Whispers from the Star”。


      這游戲隔壁的小發(fā)還玩兒過(guò):,挺特殊的。

      從這些產(chǎn)品的定位也能看出,Anuttacon 的初衷就是做 AI + 游戲的一些前沿嘗試。

      所以這次的 LPM-1.0 也不例外,你看名字,LPM 不就是“老婆們”么,這模型就是朝著把你的二次元老婆們復(fù)活來(lái)的。

      蔡喵就是蔡浩宇


      當(dāng)然,玩笑歸玩笑,模型能力從官網(wǎng)放出的展示來(lái)看,可是一點(diǎn)兒不胡鬧,其中讓人印象最深的就是這非常絲滑的實(shí)時(shí)對(duì)話了。

      演示里根據(jù)之前米家的虛擬角色形象“鹿鳴”構(gòu)建了個(gè)真人版,可以在網(wǎng)頁(yè)中和她實(shí)時(shí)對(duì)話。

      這里切換語(yǔ)言到中文后,讓她推薦二次元游戲,可以看到回答的效果非常自然,雖然播音腔濃厚了點(diǎn),但聲音和表情的對(duì)應(yīng)是融洽的。

      而且不同于一般的視頻模型,這里的展示是有一種互動(dòng)性,能持續(xù)進(jìn)行的。

      這就是它的特殊之處了,LPM-1.0 的核心定位不是一次性的生成,而是持續(xù)性的表演,讓對(duì)話變得具有交互感。

      所以與其說(shuō)它是視頻生成模型,倒不如說(shuō)它更像是之前數(shù)字人技術(shù)的升級(jí)版。

      數(shù)字人其實(shí)大伙兒也不陌生,只要點(diǎn)開(kāi)過(guò)上面這種直播間,里面的主播就是數(shù)字人,輸入指令,你甚至能讓主播“喵”一百聲。。。

      別看上面這位口型都對(duì)不準(zhǔn),背后燒的 Token 可不少。

      為了支撐她跟觀眾實(shí)時(shí)互動(dòng),后臺(tái)需要一個(gè)低延遲語(yǔ)音對(duì)話 Agent,加上一套實(shí)時(shí)說(shuō)話的人臉生成系統(tǒng),還得再套一層直播推流和運(yùn)營(yíng)控制臺(tái),非常繁瑣。


      而這次的 LPM-1.0 直接將前兩個(gè)部分整合了一下,直播互動(dòng)更方便了。

      官方也直接告訴大伙兒,模型主打的就是無(wú)限的視頻生成時(shí)長(zhǎng),只要你想,這對(duì)話能一直進(jìn)行下去。。。


      既然是跟數(shù)字人技術(shù)對(duì)比,正好之前也有快手的 KlingAvatar-2.0 和字節(jié)的 OminiHuman 15,都是同類的生成模型,放在一起就能看出 LPM-1.0 的質(zhì)量怎么樣了。

      這次的 LPM 模型分了兩種,一種是離線的 Base 模型,和普通的視頻模型一樣,給定提示詞去生成視頻;另一種就是 Online 模型,就是最開(kāi)始演示的那樣,具有交互感,實(shí)時(shí)生成的模型了。

      這里先拿離線的 Base 基礎(chǔ)模型來(lái)舉例,生成 720p 分辨率的仿直播視頻,別的不說(shuō),就“活人感”這方面還是很出色的。

      在對(duì)比視頻里,最左邊的 LPM-1.0 跟另外幾個(gè)模型相比,生成時(shí)間更長(zhǎng),持續(xù)性以及面部表情都更加自然。

      一方面,人物能夠根據(jù)說(shuō)的話配合一些肢體動(dòng)作;另一方面,跟音頻的配合也更緊密,不會(huì)像其他模型那樣被背景音樂(lè)干擾,去跟不屬于角色的聲音對(duì)嘴型。


      不過(guò)美中不足的是,當(dāng)切換到實(shí)時(shí)生成的 Online 模型,還原真實(shí)直播場(chǎng)景時(shí),效果就打了個(gè)折。

      比如下面官方給的 Demo,就只有 480p 的分辨率,雖然看著還行,但確實(shí)不如離線模型生成的穩(wěn)定,動(dòng)作大點(diǎn)就容易看出 AI 感。

      再來(lái)看模型刻在名字里的表演,放到生成的視頻里,就是看人物的表情動(dòng)作和情緒變化對(duì)不對(duì)得上。

      畢竟咱也刷到過(guò)那種用力過(guò)猛的,或者動(dòng)作肌無(wú)力的,只要表演的度把握不好,就容易出現(xiàn)偽人感。


      看 Demo 對(duì)多種情緒的展示,絕望憤怒等情緒中規(guī)中矩,但一些波動(dòng)比較小的情緒,像悲傷或者沮喪,面部細(xì)節(jié)還挺多的,表現(xiàn)的效果也非常自然。

      不過(guò),表演這塊兒人類還是很挑剔的,再加上蘿卜青菜各有所愛(ài),所以到底哪種程度剛剛好咱也說(shuō)不太準(zhǔn)兒。

      但要是后面能給一些更細(xì)的,更可控的參數(shù)選項(xiàng),這發(fā)揮空間就更大了。


      那這么好玩兒的模型,Anuttacon 是怎么搓出來(lái)的呢?

      其實(shí)這得歸功于 LPM 新的流式架構(gòu)了,這架構(gòu)非常靈活,而參數(shù)大概在 17B(170 億)左右,原生支持文本,語(yǔ)音和圖片輸入,原理上后期也能拓展到視頻輸入。


      至于模型最重要的視覺(jué)能力,Anuttacon 則走了個(gè)捷徑,訓(xùn)練時(shí)是在阿里的開(kāi)源模型 Wan 2.1-I2V 上的,效果拔群。

      這也是開(kāi)源的好處,節(jié)省出這些造輪子的功夫,也好給咱帶來(lái)更多好活兒。


      除此之外,模型還原生支持“全雙工”的自然對(duì)話,就是既有“聽(tīng)”的反饋,又有“說(shuō)”的表演。

      這依賴于新引入的交替式雙音頻注入機(jī)制:模型內(nèi)部的偶數(shù)層處理說(shuō)話音頻,奇數(shù)層處理傾聽(tīng)音頻。

      說(shuō)大白話就是把對(duì)話音頻拆成兩部分處理,一部分負(fù)責(zé)體現(xiàn)聆聽(tīng),另一部分負(fù)責(zé)表演說(shuō)話,將交互拆成不同內(nèi)容進(jìn)行處理,更細(xì)了,也就更自然了。


      當(dāng)然,模型輸出的形式還是視頻,所以和視頻模型一樣,怎么控制人物主體的一致性還是必須要解決的難題。

      從模型的技術(shù)報(bào)告里能看出,他們的方案是不依賴單張圖片,而是拿 1 張全局圖、1-4 個(gè)身體多視角圖、1-8 種面部表情圖綜合起來(lái)控制。

      除了加多參考圖,模型內(nèi)部還特意對(duì)表情圖和視角圖進(jìn)行了特征區(qū)分,換句話說(shuō)就是模型在生成視頻時(shí),能認(rèn)出特征的不同類型,不容易因?yàn)樘卣鳑_突而陷入混亂。


      而在這些基礎(chǔ)上,還有一堆注意力細(xì)節(jié)的調(diào)控,以及特征錨點(diǎn)的設(shè)置,總之就是拼盡全力去確保人物做動(dòng)作時(shí)不變形。

      當(dāng)然,由于這模型演示的場(chǎng)景人物動(dòng)作的幅度都比較小,樣本不多,所以其他情況的效果還有待實(shí)測(cè),只能看后續(xù)有沒(méi)有其他模型按這個(gè)思路試試了。


      那對(duì)話有了,人物也一致了,延遲是怎么降下來(lái)的呢?

      其實(shí)也不復(fù)雜,就是先拿主干模型生成粗略的草稿,再拿細(xì)化模型填補(bǔ)面部和動(dòng)作細(xì)節(jié),分工明確,流水線式生成。

      這么一來(lái),推理步驟被壓縮成了 2+1,一共才三步,再加上一些流式編碼和并發(fā)執(zhí)行技術(shù),整個(gè)對(duì)話過(guò)程的延遲被大幅降低。


      在技術(shù)報(bào)告里,他們還透露了具體的架構(gòu),就是用主干(Backbone)加細(xì)化(Refiner)的方式將原來(lái)龐大的擴(kuò)散模型轉(zhuǎn)換成了簡(jiǎn)單的自回歸網(wǎng)絡(luò)。

      而有了這些技術(shù)的助力,也就能支撐 LPM-1.0 去無(wú)限時(shí)長(zhǎng)的實(shí)時(shí)(低延遲)對(duì)話了。


      當(dāng)然,以上這些咱也只是云了一波,因?yàn)檫@次的發(fā)布并不是模型或者產(chǎn)品的發(fā)布,只是技術(shù)和樣例的展示。

      換句話說(shuō),雖然一些技術(shù)思路以及視頻的效果都挺亮眼,但咱還用不到,而且到手里用起來(lái)具體什么樣也是未知。

      不過(guò)就上面展示的效果來(lái)看,喜歡看直播的家人們有福了,因?yàn)橐院笃聊磺翱雌饋?lái)形形色色的主播,后面坐著的可能連人都不是了。。。

      撰文:風(fēng)華

      編輯:早起 & 江江 & 面線

      美編:煥妍

      圖片、資料來(lái)源

      LPM技術(shù)報(bào)告,NVIDIA官網(wǎng),X,小紅書(shū),知乎,網(wǎng)絡(luò)


      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      新一輪的一地雞毛,正在上演

      新一輪的一地雞毛,正在上演

      黑噪音
      2026-04-21 14:40:02
      北大饒毅教授發(fā)文:“再刪試試看”

      北大饒毅教授發(fā)文:“再刪試試看”

      TOP大學(xué)來(lái)了
      2026-04-21 22:33:06
      東莞信托有限公司原董事張孟軍被查

      東莞信托有限公司原董事張孟軍被查

      財(cái)聯(lián)社
      2026-04-22 09:06:05
      2032奧運(yùn)主辦地確定,結(jié)果吃驚全球,奧運(yùn)格局將重塑

      2032奧運(yùn)主辦地確定,結(jié)果吃驚全球,奧運(yùn)格局將重塑

      天馬幸福的人生
      2026-04-22 06:41:59
      若沒(méi)有此人,中國(guó)歷史或?qū)⒏膶?xiě)!晚年離休后享受什么待遇?

      若沒(méi)有此人,中國(guó)歷史或?qū)⒏膶?xiě)!晚年離休后享受什么待遇?

      史之銘
      2026-04-19 15:49:20
      美股期貨集體拉升,特朗普稱美伊最終將達(dá)成重大協(xié)議

      美股期貨集體拉升,特朗普稱美伊最終將達(dá)成重大協(xié)議

      21世紀(jì)經(jīng)濟(jì)報(bào)道
      2026-04-22 09:05:57
      67萬(wàn)億重磅落地!比08年還兇猛,房?jī)r(jià)或變天?普通人該如何應(yīng)對(duì)?

      67萬(wàn)億重磅落地!比08年還兇猛,房?jī)r(jià)或變天?普通人該如何應(yīng)對(duì)?

      阿離家居
      2026-04-21 17:32:40
      保價(jià)2000元機(jī)蓋運(yùn)輸中損壞,德邦理賠只肯賠1300元;車主:我不要錢(qián)了,你賠我一個(gè)機(jī)蓋總可以吧

      保價(jià)2000元機(jī)蓋運(yùn)輸中損壞,德邦理賠只肯賠1300元;車主:我不要錢(qián)了,你賠我一個(gè)機(jī)蓋總可以吧

      大風(fēng)新聞
      2026-04-20 19:12:04
      中日若開(kāi)戰(zhàn):不打則已,一打必定百年格局

      中日若開(kāi)戰(zhàn):不打則已,一打必定百年格局

      安安說(shuō)
      2026-03-27 11:59:52
      10萬(wàn)億經(jīng)營(yíng)貸,要兜不住了

      10萬(wàn)億經(jīng)營(yíng)貸,要兜不住了

      新浪財(cái)經(jīng)
      2026-04-22 03:04:25
      國(guó)臺(tái)辦果然沒(méi)看錯(cuò),鄭麗文真面目被徹底揭露!小算盤(pán)到此為止了

      國(guó)臺(tái)辦果然沒(méi)看錯(cuò),鄭麗文真面目被徹底揭露!小算盤(pán)到此為止了

      比利
      2026-01-23 12:41:53
      威爾士凱特王妃亮相白金漢宮,著淡紫禮裙佩戴女王珍珠盡顯溫婉

      威爾士凱特王妃亮相白金漢宮,著淡紫禮裙佩戴女王珍珠盡顯溫婉

      述家?jiàn)视?/span>
      2026-04-22 09:21:04
      湖南華容縣政協(xié)黨組副書(shū)記、副主席李勁松被查

      湖南華容縣政協(xié)黨組副書(shū)記、副主席李勁松被查

      三湘都市報(bào)
      2026-04-22 11:14:02
      韓肅已任中央編辦副主任

      韓肅已任中央編辦副主任

      上觀新聞
      2026-04-22 10:36:06
      唐伯虎真跡現(xiàn)身美國(guó),世上僅此一件,網(wǎng)友:讓當(dāng)代書(shū)家汗顏

      唐伯虎真跡現(xiàn)身美國(guó),世上僅此一件,網(wǎng)友:讓當(dāng)代書(shū)家汗顏

      幸福娃3790
      2025-12-04 11:10:09
      3-2!89分鐘絕殺:國(guó)米奇跡翻盤(pán),讓二追三,法布雷加斯不敢相信

      3-2!89分鐘絕殺:國(guó)米奇跡翻盤(pán),讓二追三,法布雷加斯不敢相信

      足球狗說(shuō)
      2026-04-22 04:58:45
      千億市值的大瓜:當(dāng)“金絲雀”遇上“正宮團(tuán)”!

      千億市值的大瓜:當(dāng)“金絲雀”遇上“正宮團(tuán)”!

      挖掘機(jī)007
      2026-04-21 11:31:00
      姚晨發(fā)文怒斥深圳違規(guī)私轉(zhuǎn)患者救護(hù)車:如此草菅人命的急救車,肯定是極少數(shù),家中至親曾突發(fā)急癥叫過(guò)急救車,為家人搶回黃金急救時(shí)間

      姚晨發(fā)文怒斥深圳違規(guī)私轉(zhuǎn)患者救護(hù)車:如此草菅人命的急救車,肯定是極少數(shù),家中至親曾突發(fā)急癥叫過(guò)急救車,為家人搶回黃金急救時(shí)間

      大風(fēng)新聞
      2026-04-21 18:33:25
      0罰球!30+10!以下克上!真高級(jí)啊!!!

      0罰球!30+10!以下克上!真高級(jí)啊!!!

      柚子說(shuō)球
      2026-04-22 11:05:02
      0-3!11.7億豪門(mén)5連敗0進(jìn)球 114年恥辱紀(jì)錄誕生 歐冠門(mén)票漸行漸遠(yuǎn)

      0-3!11.7億豪門(mén)5連敗0進(jìn)球 114年恥辱紀(jì)錄誕生 歐冠門(mén)票漸行漸遠(yuǎn)

      狍子歪解體壇
      2026-04-22 04:59:21
      2026-04-22 11:36:49
      差評(píng)XPIN incentive-icons
      差評(píng)XPIN
      用知識(shí)和觀點(diǎn)Debug the world!
      10612文章數(shù) 489596關(guān)注度
      往期回顧 全部

      游戲要聞

      魔獸世界:60版本最牌面的物理命中武器,誰(shuí)才是你心中的天花板?

      頭條要聞

      牛彈琴:伊朗發(fā)出讓人毛骨悚然的警告 玩的就是心跳

      頭條要聞

      牛彈琴:伊朗發(fā)出讓人毛骨悚然的警告 玩的就是心跳

      體育要聞

      一到NBA季后賽,四屆DPOY就成了主角

      娛樂(lè)要聞

      復(fù)婚無(wú)望!baby黃曉明陪小海綿零交流

      財(cái)經(jīng)要聞

      伊朗拒絕出席 特朗普宣布延長(zhǎng)停火期限

      科技要聞

      凌晨突發(fā)!ChatGPT Images 2.0發(fā)布

      汽車要聞

      四款全球首秀+AI落地 大眾汽車集團(tuán)在華轉(zhuǎn)型全面提速

      態(tài)度原創(chuàng)

      手機(jī)
      游戲
      教育
      健康
      時(shí)尚

      手機(jī)要聞

      vivo Y600 Pro手機(jī)官宣4月27日發(fā)布,搭載10200mAh耐低溫電池

      B社絕后神作真有過(guò)續(xù)作!慘遭腰斬 再無(wú)翻身之日

      教育要聞

      歡迎報(bào)考!開(kāi)封智慧健康職業(yè)學(xué)院2026單招報(bào)考指南

      干細(xì)胞抗衰4大誤區(qū),90%的人都中招

      頂流復(fù)工,已判若兩人

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版