
哥們最近刷了這么一個(gè)游戲視頻,直接被震撼到了。
光看操作,大伙可能覺得,啥玩意操作,我上我也行。
但讓世超震驚的點(diǎn)在于,畫面里的操作,全都是由一個(gè) AI 模型獨(dú)立主動(dòng)完成的,而且是你給它啥游戲就打啥,無縫切換,我連教都不用教。。
這個(gè)模型,就是英偉達(dá)新發(fā)布的,號(hào)稱啥游戲都能玩的通用游戲模型,名字叫NitroGen。
好家伙,老黃賣我游戲卡還嫌不夠,還要讓AI來跟我搶游戲玩是吧。
我看了很多網(wǎng)友的第一反應(yīng),就是:這外掛好啊,拿來打王者吃雞,原神崩鐵,甚至旮旯game,誰(shuí)還打得過我?
![]()
但,覺得沒意義的人也挺多的,我打工買了游戲還要給AI打,那不成給AI打工的了嗎?
![]()
但不管怎么說,實(shí)力這玩意是明牌的。作為公司的游戲高手,世超已經(jīng)感到手癢難耐了。
而且,他們把這個(gè)模型開源了,包括模型權(quán)重和數(shù)據(jù)集,大伙都能下載下來并安裝到自己電腦上。
![]()
于是,世超趕緊下到了公司電腦上,想跟大伙一起來會(huì)會(huì)它的實(shí)力到底如何。
我隨便開了幾個(gè)游戲,結(jié)果發(fā)現(xiàn),它真沒騙人,確實(shí)有點(diǎn)操作。
這是 AI 在夜之城中被人追殺的精彩片段,它像開了自瞄,完成了反殺。

這是 AI 操作我的手柄,挑戰(zhàn)黑神話悟空的珍貴畫面,操作比我還6,渴了會(huì)喝藥,挨打會(huì)翻滾,甚至知道技能銜接普攻。

這是 AI 在操作我的空洞騎士,平臺(tái)跳躍也像德芙般絲滑。

它甚至能扮演雙人游戲的 Player2,跟我來一局茶杯頭,會(huì)躲避敵人還會(huì)撿金幣。
藍(lán)的是AI

不是,你真會(huì)啊?
但在我們繼續(xù)深度測(cè)試了一段時(shí)間后發(fā)現(xiàn),幫人類打游戲這事兒,好像沒想象中那么簡(jiǎn)單啊。
在黑神話里,它的確能打過 Boss ,但這建立在我裝備拉滿的基礎(chǔ)上,其實(shí)它也經(jīng)常丟失鎖定,空技能。

而在賽博朋克2077里,上面放的也只是幾個(gè)比較像頓悟了的精彩鏡頭,其實(shí)常態(tài)是開車撞墻,走路瞄地,到處亂射。

茶杯頭里,它也經(jīng)常跟不上我的節(jié)奏,我還得邊走邊扶著它往前走。。

所以,測(cè)完一圈游戲后,俺的感受是,它的水平不高,但懂得大多數(shù)游戲的基本操作,了解基本機(jī)制,就像一個(gè)剛拿到手柄的小孩,能拿著手柄跑跑圖,殺殺小怪,但遇到 Boss 就要被虐了。
而且,它只能玩能用手柄操作的游戲,因?yàn)樗挠?xùn)練數(shù)據(jù)都是用手柄操作的。
可能有些朋友要有點(diǎn)失望了,什么幫人打游戲,又是來吹牛的。
但世超覺得,即使做到這一步,也很難了,這意味著大多數(shù)游戲,它都能操作兩下子,這說明模型的泛化能力非常強(qiáng)。
像之前很多打游戲的AI,像OpenAI能打過刀塔世界冠軍的OpenAI Five,或者字節(jié)能玩原神的智能體之類的,基本都是對(duì)某一個(gè)游戲進(jìn)行特訓(xùn),所以這些 AI 的上限,就是只會(huì)打某一個(gè)游戲,甚至某一個(gè)關(guān)卡。
![]()
但英偉達(dá)這玩意,是真的和人一樣,摸兩把新游戲就能上手操作的。
世超很好奇這模型是咋訓(xùn)練出來的,于是去翻閱了下 NitroGen 的官網(wǎng)和論文。
結(jié)果,他們用了一個(gè)你能想到最簡(jiǎn)單的方式,讓AI看錄像。他們直接找到了互聯(lián)網(wǎng)上現(xiàn)成的 40,000 小時(shí)游戲視頻,涵蓋了超過 1,000 款游戲。
![]()
為了湊齊這些素材,英偉達(dá)一共收集了 38739 個(gè)視頻,平均每個(gè)視頻的時(shí)長(zhǎng)都達(dá)到了 1 小時(shí) 50 分鐘左右 。
其中,動(dòng)作 RPG 是絕對(duì)的大頭,占了總時(shí)長(zhǎng)的 34.9%,這也難怪,它玩黑神話看上去還有模有樣的。。
緊隨其后的是占了 18.4% 的平臺(tái)跳躍類游戲,也怪不得空洞騎士里能跳得那么絲滑。。
剩下的則是動(dòng)作冒險(xiǎn)、體育,甚至類銀河戰(zhàn)士惡魔城、肉鴿和吃雞類也榜上有名。
但,AI不像咱們?nèi)祟悾戳司湍軐W(xué)會(huì),因?yàn)樗鼪]手啊。
所以為了讓AI學(xué)得更輕松,英偉達(dá)特意選擇了帶手柄指示器的游戲視頻,就是為了讓AI知道,如果看見這種畫面,手柄應(yīng)該按什么鍵,搖桿推多少,游戲才能繼續(xù)下去。

為了完成這件事,英偉達(dá)煉了一個(gè)專門分析圖標(biāo)的小模型,然后用算法把每一幀畫面的按鍵動(dòng)作硬生生摳了出來。
然后再訓(xùn)練 AI 看圖操作,比如看見車頭卡住,就意味著應(yīng)該拉手柄上的搖桿,倒車了。
從某種意義上,它就是一個(gè)看了無數(shù)直播、自學(xué)成才的頂級(jí)云玩家。
我們用它打游戲時(shí),它會(huì)瘋狂截屏,然后把當(dāng)前屏幕狀態(tài)交給AI分析,然后根據(jù)當(dāng)前屏幕的戰(zhàn)況,讓AI決策下一步的操作。
但在我們實(shí)測(cè)的過程中,我們還發(fā)現(xiàn)了一個(gè)問題,就是AI打游戲的時(shí)候,畫面怎么是一卡一卡的?

我知道,是子彈時(shí)間!對(duì)AI來說,一幀能玩,兩幀流暢,三幀就能打電競(jìng)。
誒,并非如此。其實(shí)這是英偉達(dá)故意設(shè)計(jì)的,因?yàn)樵诖蛴螒驎r(shí),讓AI看屏幕,再推理下一步的操作,非常吃算力,AI 的腦子根本轉(zhuǎn)不了游戲那么快。
為了讓它能控制市面上任何一款商業(yè)游戲,英偉達(dá)開發(fā)了一個(gè),能直接攔截游戲里系統(tǒng)時(shí)鐘的工具。
如果 AI 沒算好下一步的操作,程序的底層代碼就會(huì)發(fā)力,直接讓游戲時(shí)間暫停;AI 算好了,游戲才會(huì)繼續(xù)下一幀。
AI 其實(shí)是用這種方式,強(qiáng)行把所有游戲變成了回合制:游戲走一步,等它思考一會(huì),再走下一步。如果你去代碼里,強(qiáng)行關(guān)掉這個(gè)減速掛,它就會(huì)因?yàn)榉磻?yīng)不過來而像失去了智力,瞬間紅溫開擺。

而且論文也說,NitroGen 只訓(xùn)練了它的下意識(shí)反應(yīng),也就是我們常說的肌肉記憶。
它腦子其實(shí)很簡(jiǎn)單,看見有人打它,不是躲避就是反擊,沒什么規(guī)劃能力,像什么玩戰(zhàn)術(shù)啊,逃課啊都太難了,它只有對(duì)每一幀的條件反射。
這也是為啥,它經(jīng)常會(huì)在不需要跳的地方亂跳,或者對(duì)著空氣揮劍。

最后,對(duì)咱游戲玩家來說,可能會(huì)更關(guān)注它的游戲能力。但其實(shí)對(duì)科研人員來說,它的價(jià)值不在于通關(guān),而在于“通用”。
NitroGen 雖然菜,但它不挑食。隨便給它游戲,它雖然玩得爛,但它能動(dòng)起來,而且知道哪個(gè)鍵是跳,哪個(gè)鍵是打,哪個(gè)是敵人。
英偉達(dá)自己也說了,真正的目的不是幫你開掛,是為了造福機(jī)器人的研究。
![]()
如果每個(gè)機(jī)器人剛出廠,天生就知道“遇到臺(tái)階要跳”、“看到杯子要伸手”,跟人類的條件反射一樣,就相當(dāng)于給機(jī)器人賦予了直覺,倒了知道爬,疼了知道躲,訓(xùn)練起來就會(huì)輕松很多。
正如英偉達(dá)機(jī)器人總監(jiān) Jim Fan 所說,他們想做的是通用型機(jī)器人,不僅能搞定現(xiàn)實(shí)世界的物理規(guī)律,還能適應(yīng)虛擬世界里的各種規(guī)則。
哪怕它現(xiàn)在還像個(gè)三歲小孩,但每一個(gè)頂級(jí)高手,都是從菜雞練起來的。
總之,這玩意是個(gè)有研究?jī)r(jià)值的科研項(xiàng)目,感興趣的朋友可以下載跑一跑;但如果你只是想找個(gè)掛幫你打游戲,那還是洗洗睡吧,還不如讓你親戚家小孩來呢。
撰文:不咕
編輯:江江&面線
美編:煥妍
圖片、資料來源:
NitroGen,BiliBili,YouTube
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.