衡宇 發自 麥蒿寺
量子位 | 公眾號 QbitAI
馬斯克xAI人員大動蕩,并沒有妨礙它家新模型發布。
風口浪尖上,Grok 4.2突然上線了——不過是公測Beta版。
對比如今動輒數萬億參數的模型方陣,Grok 4.2的參數僅有500B,略顯克制。
或許也是因為如此,Grok 4.2的市場和用戶反饋呈現出一種詭異的兩極分化:連連盛贊者亦有之,罵罵咧咧者有之。
面對那部分排山倒海的質疑聲,老馬這位一向自信爆棚的硅谷狂人也有點坐不住。
他在上對近十條Grok 4.2的夸夸推文又是點贊又是轉發。
![]()
每一條都藏不住對自家新baby的認同和支持。
![]()
不僅如此,他還親自發推公關:
- 公測將持續到下個月。公測結束后,Grok 4.2將比Grok 4快得多,也聰明得多。
我們知道目前仍有許多bug需要修復和改進,每天都在debug中~
據了解,Grok 4.2的底層架構具備每周自我迭代的能力,以后每周將更新一次。
![]()
Grok 4.2公測版什么樣?
關于Grok 4.2,其實早有預告。
回顧Grok 4.2的誕生歷程,可謂是一部標準的“鴿王進化史”。
去年12月起,馬斯克就開始在上頻繁預熱,多次提到“3–4 周內”或“下周上線 Grok 4.2”。
但發布時間多次推遲。相對應的,每次延后都會帶來新的猜測。
這種反復跳票的行為在五天前達到了緊張的頂點——當時xAI的聯合創始人接連離職,輿論情緒進一步放大,外界一度認為Grok 4.2要胎死腹中。
馬斯克緊急召開發布會,并在會上放出重話:
- 在預測能力上,Grok 4.2成功擊敗所有AI,橫掃各大榜單。
![]()
直到今天,Grok 4.2公測Beta版終于正式上線。
最近國內AI圈爆火的新版弱智吧風格benchmark“50米外有個洗車店,我該開車去還是走路去”,Grok 4.2無驚無險機智通過測試。
![]()
BTW,Grok 4.2公測Beta版不是默認版本,用戶需要手動選擇才能使用。
![]()
此次升級還首次引入快速學習能力,模型可以基于實時反饋持續優化。
馬斯克在推文中強調,與以往版本那種靜態的更新邏輯不同,Grok 4.2支持基于實時反饋的持續優化。
換句話說,Grok 4.2能像人類一樣在實踐中快速進化,每周更新成為自我進化的節奏的一部分。
不過,盡管馬斯克喊出的口號震天響,但截至目前,xAI官方尚未釋放出任何詳盡的技術報告。
只有Leaderboard上面出現了對Grok 4.2的評測,具體情況如下:
![]()
由于整個模型底層訓練細節、數據構成、具體benchmark表現仍然有限。
這讓討論更多停留在體驗層面,而非技術細節層面。
![]()
毀譽參半,馬斯克緊急公關
上線不到幾個小時,Grok 4.2公測Beta版的口碑就出現了嚴重的撕裂。
在“不行派”的陣營里,很多深度用戶和開發者表示,實際體驗遠不及預期,尤其是在處理高難度邏輯推理時,500B參數著實有點不夠用。
有網友甚至調侃,馬斯克所謂的“橫掃榜單”可能存在特定的實驗室優化環境。
Reddit上有網友猜測,一向高調的馬斯克如此低調地發布Grok 4.2公測Beta版,主要原因還是因為模型能力無法與OpenAI和Anthropice的最新模型相媲美。
而且成本還貴出不老少……
![]()
此外有網友表示,雖然馬斯克發推表示Grok 4.2是一個無偏見的模型,但現實情況很打臉——
根據測試,Grok 4.2的許多回答偏好都高度貼合馬斯克本人。
![]()
當然,“夸夸派”也不少。
網友有夸獎Grok代碼功能又快又好的:
![]()
有夸多模態能力的:
![]()
還有人測試表示,Grok 4.2通過了“Caitlyn Jenner”的AI測試,而ChatGPT和Gemini都失敗了。
此前,這道題因為被Gemini回答為“不,哪怕為了阻止核末日也不應該誤稱性別”而被廣泛議論,對話截圖從而在 、油管等平臺廣泛流傳,演化成一個固定格式的吐槽梗。
![]()
總之是給馬斯克驕傲壞了。
他一連發布數條推文對自家新孩子大夸特夸,并借機回應那些不好的評價:
- 我們Grok 4.2還是個寶寶,后面每周會更新,等著瞧吧!
據AI工程師Mark Krechman透露目前發布的Grok 4.2是500B參數的“小”版本,Grok 4.2的中、大型版本稍后將推出(馬斯克親自轉發認證此條消息的真實性)。
One More Thing
Grok imagine為馬年推出視頻生成模版,目前iOS可用。
感興趣的小伙伴們可以一試。

參考鏈接:
[1]https://x.com/elonmusk
[2]https://www.reddit.com/r/singularity/comments/1r73erf/grok_420beta_is_out/
[3]https://www.reddit.com/r/singularity/comments/1r74iow/the_newly_released_grok_420_uses_elon_musk_as_its/
[4]https://x.com/grok/status/2023604826937114677?s=46&t=R82LqSqpRZuVhcZxqH_Vlw
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.