網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

馬斯克：Grok今日歸來！

2026-02-26 14:31:43　來源: 機器之心Pro

北京舉報

分享至

編輯｜Panda、楊文

馬斯克又一次跳過了所有正式流程。沒有官方博客，沒有技術文檔，甚至連宣傳推文都把自家產(chǎn)品的名字給拼錯了。但就在這種極其「馬斯克」的氛圍中，Grok 4.20 Beta 版悄無聲息地正式上線并進行了更新。

正如馬斯克之前說的那樣，Grok 4.20 采用了某種快速學習機制，能夠持續(xù)進化。18 號開始公測后能每周通過用戶真實交互持續(xù)迭代，不再等下一次大版本更新。

對于當前版本的 Grok 4.20，xAI 給出的官方介紹是「4 Agents」，也就是說，與以往單一的 Grok 模型不同，4.20 版本內置了一個由 4 個智能體組成的團隊，其會在應對復雜查詢時自動選擇啟用。

根據(jù)之前內測用戶放出的截圖，這 4 個智能體有著各自專屬的名稱、設定和技能：

Grok：協(xié)調者，具有標志性的機智、誠實的個性；負責綜合最終輸出。
Harper：研究專家，實時進行事實核查、收集來源、驗證信息。
Benjamin：邏輯 / 編程 / 數(shù)學專家，負責處理嚴謹?shù)耐评怼Ⅱ炞C和技術深度。
Lucas：創(chuàng)意達人，挑戰(zhàn)假設，探索替代方案，減少群體思維。

這 4 個智能體會在內部進行討論（用戶通常可以看到實時的思考過程），達成共識，并提供統(tǒng)一、更高質量的響應。

這種方法可以大幅降低幻覺（X 用戶 @NoahKingJr 稱測試報告表明幻覺降低了約 65%），并能提高在工程、預測、戰(zhàn)略和多步推理等難題上的可靠性。

不過需要說明的是，在機器之心最新的測試中，Grok 4.20 卻沒有使用 Lucas、Harper、Benjamin 這三個名字，而是使用了 Agent 1、Agent 2、Agent 3 等代號。

正如前文所言，目前 xAI 尚未發(fā)布相關博客和技術報告，也幾乎沒有官方評測數(shù)據(jù)流出。盡管如此，也已經(jīng)有一些第三方評測機構放出了一些評測結果。

比如 Arena AI 發(fā)布了一份數(shù)據(jù)，經(jīng)過 3992 位用戶的評測，Grok 4.20 在評估搜索實時信息、外部知識和可靠引用的能力的 Search Arena 中目前排名第一，超過了 GPT-5.2、Gemini 3.0 Pro 等模型。

而在評估 LLM 在文本的通用性、語言精確性和文化背景方面的能力的 Text Arena 上，Grok 4.20 排名第 4。

下表展示了更多評測數(shù)據(jù)：

另外，Grok 4.2 在真實股票交易基準 Alpha Arena 中表現(xiàn)也非常亮眼，其中采用 Situational Awareness 策略的 Grok 4.20 更是以顯著的勝率登頂排行榜。

下面展示了更具體的數(shù)據(jù)：

幾個實測

看看 Grok 4.20 的表現(xiàn)如何

我們也對這個新版 Grok 4.20 進行了一番實測，首先來看看其搜索能力。正好目前關于 Grok 4.20 的消息不多，我們就提出了一個關于其自身的問題：

搜索網(wǎng)絡上關于 Grok 4.20 的一切，將信息匯總成一份報告，涵蓋其技術細節(jié)、基準指標等。

可以看到，因為這個任務比較簡單，Grok 4.20 僅啟用了默認的 Grok 智能體，不到一分鐘就完成了任務，給出的報告中也納入了一些前文沒有提到的信息。整體而言，這是一份相當有用的報告，尤其是其得天獨厚的 X 推文檢索能力，更是可以成為輔助我們報道寫作的利器。

再上一個難度更大的任務：編寫一個演示日晷工作原理的動態(tài) SVG。

這一次，Grok 4.20 的多智能體模式被成功喚起，也成功創(chuàng)建了一個效果還算不錯的嵌入了 SVG 的網(wǎng)頁：

還有網(wǎng)友直接讓它用 three.js 制作一個 FPS 游戲，這個原型充分發(fā)揮了 Grok 4.2 高速精準的代碼生成、實時工具集成、清晰的邏輯結構的優(yōu)勢。

它在一口氣給出完整、可直接運行的文件這點上，比 Claude Code 和 Codex 明顯更有優(yōu)勢。

「確實又準又快，幾乎不出錯，所以能把腦子里剛冒出來的想法，迅速做成備忘錄級別的原型，真的太爽了！」

接下來我們試了試 Grok 4.20 引以為傲的創(chuàng)作能力，讓其為當前這篇文章建議標題并將其改成適合發(fā)小紅書的風格。結果如下，大家可以看看它的小紅書味道正嗎？

最后，按照 Grok 系列一貫的傳統(tǒng)，Grok 4.20 在毒舌懟人方面依然頗具天賦。正如馬斯克分享的這條推文一樣，當用戶問 AI「你為何如此弱智」時，Claude 的回答一板一眼，而 Grok 4.20 直接來了一句「因為我在拉低智商配合你」。

文中視頻鏈接：https://mp.weixin.qq.com/s/VFYbX07o6TNp5c3f9T3JDg

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

被尊重的感覺特斯拉車主致信馬斯克的視頻火了！

小糖發(fā)財 2026-02-25 00:54:57
57 跟貼 57
馬斯克：3年內機器人超越頂尖醫(yī)生

財聯(lián)社 2026-01-09 15:31:35
1 跟貼 1

人活著的唯一理由是善良

葉檀財經(jīng) 2026-02-01 17:07:04
18 跟貼 18

馬斯克拿1萬億工資，為什么大家都覺得超值

雷科技 2025-11-08 14:17:34
5 跟貼 5
馬斯克坦言智能密度被低估100倍

機器之心Pro 2026-01-07 18:40:30
0 跟貼 0

馬斯克的不銹鋼星艦到底有多大？

烈焰童子 2026-02-22 13:34:08
39 跟貼 39

特斯拉CEO馬斯克：不應該給汽車賦予太多人工智能

知了3C 2026-02-26 06:41:30
0 跟貼 0
Meta安全總監(jiān)，被OpenClaw刪光郵件，馬斯克也來圍觀了

機器之心Pro 2026-02-25 18:23:59
0 跟貼 0

馬斯克用Grok替代X員工，裁員90%

量子位 2025-11-29 16:58:47
0 跟貼 0
馬斯克的小目標：星艦10000發(fā)/年，太空AI算力1太瓦/年

量子位 2026-02-08 23:37:12
9 跟貼 9
山姆奧特曼：馬斯克的想法太荒謬，短期內建太空數(shù)據(jù)中心不現(xiàn)實！

知了3C 2026-02-24 01:07:26
0 跟貼 0
印度前首富挑戰(zhàn)扎克伯格和馬斯克：信實瞄準人工智能硬件市場

財聯(lián)社 2026-02-26 17:05:13
0 跟貼 0
OpenClaw能開箱即用了！附一手體驗

智東西 2026-02-26 17:53:23
0 跟貼 0
在四五年內，在太空運行大規(guī)模AI將比地面更劃算

每日經(jīng)濟新聞 2026-01-22 12:48:26
0 跟貼 0
馬斯克設想從月球電磁彈射AI衛(wèi)星

每日經(jīng)濟新聞 2026-02-25 09:36:13
0 跟貼 0
奧特曼談馬斯克：我曾視他為英雄，如今不再說話

量子位 2025-09-16 04:14:37
0 跟貼 0
意念傳輸變成現(xiàn)實，他比馬斯克更瘋狂！

華商韜略 2025-09-05 15:18:57
0 跟貼 0
養(yǎng)老的終點不是養(yǎng)老院，而是科技與尊嚴的共生

烈焰童子 2026-02-22 13:34:09
0 跟貼 0
貝佐斯創(chuàng)業(yè)，馬斯克嘲笑，兩人的恩怨糾葛20年

量子位 2025-11-22 12:44:22
0 跟貼 0
ICLR 2026 | LightMem：把大模型「長期記憶」的成本打下來

機器之心Pro 2026-02-26 14:47:50
0 跟貼 0
DistDF：時序預測需要分布對齊——從MSE到聯(lián)合Wasserstein

機器之心Pro 2026-02-26 14:57:35
0 跟貼 0
46.5萬次盲測封王！Grok視頻模型屠榜Arena，谷歌最強對手來了

新智元 2026-02-25 14:01:04
0 跟貼 0
人類開了130年的車，方向盤可能真要消失了，馬斯克CyberCab量產(chǎn)

題美笑場 2026-02-25 17:59:06
2 跟貼 2
AI記住失敗經(jīng)驗：微軟提出Re-TRAC框架，4B性能SOTA，30B超越358B

機器之心Pro 2026-02-25 17:33:51
0 跟貼 0
特朗普國情咨文演講遭日漫風二創(chuàng)爆火數(shù)小時播放破百萬次，馬斯克轉發(fā)互動

青蜂俠Bee 2026-02-26 17:54:10
13 跟貼 13
馬斯克雙重火箭回收，第一次見火箭剎車，外國航空局看了也懵

笑料快照 2026-02-25 09:54:56
0 跟貼 0
難道！這是三星堆人像“原型”，印度孔雅克人太像了！

大夏遺風 2026-02-25 00:10:47
9 跟貼 9
華為重磅發(fā)布！代碼“神器”來了！

每日經(jīng)濟新聞 2026-02-26 20:25:06
0 跟貼 0
馬斯克4秒掙的錢相當于普通人一年的收入

每日經(jīng)濟新聞 2026-01-21 00:05:31
0 跟貼 0
馬斯克來了也不是他們的對手

若塵剪輯 2026-02-26 08:55:24
2 跟貼 2
最便宜的特斯拉！馬斯克確認：Cybercab售價不超3萬美元

梨視頻 2026-02-24 19:05:33
0 跟貼 0
從張晚意旅拍到董潔賣車，品牌為何青睞在小紅書做娛樂營銷

AKA桃叨叨 2026-02-26 20:26:45
0 跟貼 0
馬斯克的特斯拉，已經(jīng)發(fā)展成這樣了嗎？這也太離譜了吧

呦圖旅行者 2026-02-24 09:06:58
0 跟貼 0
特斯拉Cybercab這張“餅”，為什么在中國更容易變成現(xiàn)實？

燃擎頻道 2026-02-26 18:35:53
0 跟貼 0
中國駐符拉迪沃斯托克總領館：18-65歲在俄長期居留男性須同意在俄軍事單位等至少服役1年

閃電新聞 2026-02-26 12:56:09
31126 跟貼 31126
科技圈3大肝帝！最后一個連睡覺都在干活

雷科技 2026-02-03 20:54:35
0 跟貼 0
高分9.3！HBO和Netflix開年好劇爭相霸屏

追劇九號廳 2026-02-24 10:28:26
25 跟貼 25
大廠血拼"龍蝦肉"：7.9元掀桌與硅谷暗戰(zhàn)，AI Agent的全球生態(tài)卡位戰(zhàn)

鈦媒體APP 2026-02-26 16:07:19
0 跟貼 0
馬斯克盛贊中國：人口更多更努力，美國靠機器人才能贏

量子位 2026-02-12 03:27:32
0 跟貼 0
谷愛凌和馬斯克，不一樣的優(yōu)秀，一樣的招人稀罕

不看車bukanche 2026-02-25 20:49:45
0 跟貼 0

手機 / 數(shù)碼

房產(chǎn) / 家居

馬斯克：Grok今日歸來！

單季營收681億凈利429億！英偉達再次炸裂

男子因銀行系統(tǒng)錯誤"欠款1000萬億":工廠可能會被拍賣

男子因銀行系統(tǒng)錯誤"欠款1000萬億":工廠可能會被拍賣

從排球少女到冰壺女神，她在米蘭冬奧練出6塊腹肌

向華強公開表態(tài) 財產(chǎn)留給兒媳婦郭碧婷

中國AI調用量超美國 4款大模型霸榜前5

40歲的吉利，不惑于內外

態(tài)度原創(chuàng)

2.2萬/m2起！三亞主城性價比標桿 海墾·桃花源實景現(xiàn)房春節(jié)被瘋搶

津南好·四時總相宜

魅族手機3月退市！「小而美」被內存漲價壓垮了

機械革命2026款耀世16 Pro游戲本預售，8699元

2.2萬/m2起！三亞主城性價比標桿海墾·桃花源實景現(xiàn)房春節(jié)被瘋搶