
哥們最近刷了這么一個游戲視頻,直接被震撼到了。
光看操作,大伙可能覺得,啥玩意操作,我上我也行。
但讓世超震驚的點在于,畫面里的操作,全都是由一個 AI 模型獨立主動完成的,而且是你給它啥游戲就打啥,無縫切換,我連教都不用教。。
這個模型,就是英偉達新發布的,號稱啥游戲都能玩的通用游戲模型,名字叫NitroGen。
好家伙,老黃賣我游戲卡還嫌不夠,還要讓AI來跟我搶游戲玩是吧。
我看了很多網友的第一反應,就是:這外掛好啊,拿來打王者吃雞,原神崩鐵,甚至旮旯game,誰還打得過我?
![]()
但,覺得沒意義的人也挺多的,我打工買了游戲還要給AI打,那不成給AI打工的了嗎?
![]()
但不管怎么說,實力這玩意是明牌的。作為公司的游戲高手,世超已經感到手癢難耐了。
而且,他們把這個模型開源了,包括模型權重和數據集,大伙都能下載下來并安裝到自己電腦上。
![]()
于是,世超趕緊下到了公司電腦上,想跟大伙一起來會會它的實力到底如何。
我隨便開了幾個游戲,結果發現,它真沒騙人,確實有點操作。
這是 AI 在夜之城中被人追殺的精彩片段,它像開了自瞄,完成了反殺。

這是 AI 操作我的手柄,挑戰黑神話悟空的珍貴畫面,操作比我還6,渴了會喝藥,挨打會翻滾,甚至知道技能銜接普攻。

這是 AI 在操作我的空洞騎士,平臺跳躍也像德芙般絲滑。

它甚至能扮演雙人游戲的 Player2,跟我來一局茶杯頭,會躲避敵人還會撿金幣。
藍的是AI

不是,你真會啊?
但在我們繼續深度測試了一段時間后發現,幫人類打游戲這事兒,好像沒想象中那么簡單啊。
在黑神話里,它的確能打過 Boss ,但這建立在我裝備拉滿的基礎上,其實它也經常丟失鎖定,空技能。

而在賽博朋克2077里,上面放的也只是幾個比較像頓悟了的精彩鏡頭,其實常態是開車撞墻,走路瞄地,到處亂射。

茶杯頭里,它也經常跟不上我的節奏,我還得邊走邊扶著它往前走。。

所以,測完一圈游戲后,俺的感受是,它的水平不高,但懂得大多數游戲的基本操作,了解基本機制,就像一個剛拿到手柄的小孩,能拿著手柄跑跑圖,殺殺小怪,但遇到 Boss 就要被虐了。
而且,它只能玩能用手柄操作的游戲,因為它的訓練數據都是用手柄操作的。
可能有些朋友要有點失望了,什么幫人打游戲,又是來吹牛的。
但世超覺得,即使做到這一步,也很難了,這意味著大多數游戲,它都能操作兩下子,這說明模型的泛化能力非常強。
像之前很多打游戲的AI,像OpenAI能打過刀塔世界冠軍的OpenAI Five,或者字節能玩原神的智能體之類的,基本都是對某一個游戲進行特訓,所以這些 AI 的上限,就是只會打某一個游戲,甚至某一個關卡。
![]()
但英偉達這玩意,是真的和人一樣,摸兩把新游戲就能上手操作的。
世超很好奇這模型是咋訓練出來的,于是去翻閱了下 NitroGen 的官網和論文。
結果,他們用了一個你能想到最簡單的方式,讓AI看錄像。他們直接找到了互聯網上現成的 40,000 小時游戲視頻,涵蓋了超過 1,000 款游戲。
![]()
為了湊齊這些素材,英偉達一共收集了 38739 個視頻,平均每個視頻的時長都達到了 1 小時 50 分鐘左右 。
其中,動作 RPG 是絕對的大頭,占了總時長的 34.9%,這也難怪,它玩黑神話看上去還有模有樣的。。
緊隨其后的是占了 18.4% 的平臺跳躍類游戲,也怪不得空洞騎士里能跳得那么絲滑。。
剩下的則是動作冒險、體育,甚至類銀河戰士惡魔城、肉鴿和吃雞類也榜上有名。
但,AI不像咱們人類,看了就能學會,因為它沒手啊。
所以為了讓AI學得更輕松,英偉達特意選擇了帶手柄指示器的游戲視頻,就是為了讓AI知道,如果看見這種畫面,手柄應該按什么鍵,搖桿推多少,游戲才能繼續下去。

為了完成這件事,英偉達煉了一個專門分析圖標的小模型,然后用算法把每一幀畫面的按鍵動作硬生生摳了出來。
然后再訓練 AI 看圖操作,比如看見車頭卡住,就意味著應該拉手柄上的搖桿,倒車了。
從某種意義上,它就是一個看了無數直播、自學成才的頂級云玩家。
我們用它打游戲時,它會瘋狂截屏,然后把當前屏幕狀態交給AI分析,然后根據當前屏幕的戰況,讓AI決策下一步的操作。
但在我們實測的過程中,我們還發現了一個問題,就是AI打游戲的時候,畫面怎么是一卡一卡的?

我知道,是子彈時間!對AI來說,一幀能玩,兩幀流暢,三幀就能打電競。
誒,并非如此。其實這是英偉達故意設計的,因為在打游戲時,讓AI看屏幕,再推理下一步的操作,非常吃算力,AI 的腦子根本轉不了游戲那么快。
為了讓它能控制市面上任何一款商業游戲,英偉達開發了一個,能直接攔截游戲里系統時鐘的工具。
如果 AI 沒算好下一步的操作,程序的底層代碼就會發力,直接讓游戲時間暫停;AI 算好了,游戲才會繼續下一幀。
AI 其實是用這種方式,強行把所有游戲變成了回合制:游戲走一步,等它思考一會,再走下一步。如果你去代碼里,強行關掉這個減速掛,它就會因為反應不過來而像失去了智力,瞬間紅溫開擺。

而且論文也說,NitroGen 只訓練了它的下意識反應,也就是我們常說的肌肉記憶。
它腦子其實很簡單,看見有人打它,不是躲避就是反擊,沒什么規劃能力,像什么玩戰術啊,逃課啊都太難了,它只有對每一幀的條件反射。
這也是為啥,它經常會在不需要跳的地方亂跳,或者對著空氣揮劍。

最后,對咱游戲玩家來說,可能會更關注它的游戲能力。但其實對科研人員來說,它的價值不在于通關,而在于“通用”。
NitroGen 雖然菜,但它不挑食。隨便給它游戲,它雖然玩得爛,但它能動起來,而且知道哪個鍵是跳,哪個鍵是打,哪個是敵人。
英偉達自己也說了,真正的目的不是幫你開掛,是為了造福機器人的研究。
![]()
如果每個機器人剛出廠,天生就知道“遇到臺階要跳”、“看到杯子要伸手”,跟人類的條件反射一樣,就相當于給機器人賦予了直覺,倒了知道爬,疼了知道躲,訓練起來就會輕松很多。
正如英偉達機器人總監 Jim Fan 所說,他們想做的是通用型機器人,不僅能搞定現實世界的物理規律,還能適應虛擬世界里的各種規則。
哪怕它現在還像個三歲小孩,但每一個頂級高手,都是從菜雞練起來的。
總之,這玩意是個有研究價值的科研項目,感興趣的朋友可以下載跑一跑;但如果你只是想找個掛幫你打游戲,那還是洗洗睡吧,還不如讓你親戚家小孩來呢。
撰文:不咕
編輯:江江&面線
美編:煥妍
圖片、資料來源:
NitroGen,BiliBili,YouTube
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.