<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      馬斯克xAI新模型上線,通過“50米外洗車店”測試

      0
      分享至

      衡宇 發自 麥蒿寺
      量子位 | 公眾號 QbitAI

      馬斯克xAI人員大動蕩,并沒有妨礙它家新模型發布。

      風口浪尖上,Grok 4.2突然上線了——不過是公測Beta版

      對比如今動輒數萬億參數的模型方陣,Grok 4.2的參數僅有500B,略顯克制。

      或許也是因為如此,Grok 4.2的市場和用戶反饋呈現出一種詭異的兩極分化:連連盛贊者亦有之,罵罵咧咧者有之。

      面對那部分排山倒海的質疑聲,老馬這位一向自信爆棚的硅谷狂人也有點坐不住

      他在上對近十條Grok 4.2的夸夸推文又是點贊又是轉發。



      每一條都藏不住對自家新baby的認同和支持。



      不僅如此,他還親自發推公關:

      • 公測將持續到下個月。公測結束后,Grok 4.2將比Grok 4快得多,也聰明得多。
        我們知道目前仍有許多bug需要修復和改進,每天都在debug中~

      據了解,Grok 4.2的底層架構具備每周自我迭代的能力,以后每周將更新一次



      Grok 4.2公測版什么樣?

      關于Grok 4.2,其實早有預告。

      回顧Grok 4.2的誕生歷程,可謂是一部標準的“鴿王進化史”。

      去年12月起,馬斯克就開始在上頻繁預熱,多次提到“3–4 周內”或“下周上線 Grok 4.2”。

      但發布時間多次推遲。相對應的,每次延后都會帶來新的猜測。

      這種反復跳票的行為在五天前達到了緊張的頂點——當時xAI的聯合創始人接連離職,輿論情緒進一步放大,外界一度認為Grok 4.2要胎死腹中

      馬斯克緊急召開發布會,并在會上放出重話:

      • 在預測能力上,Grok 4.2成功擊敗所有AI,橫掃各大榜單。



      直到今天,Grok 4.2公測Beta版終于正式上線。

      最近國內AI圈爆火的新版弱智吧風格benchmark“50米外有個洗車店,我該開車去還是走路去”,Grok 4.2無驚無險機智通過測試。



      BTW,Grok 4.2公測Beta版不是默認版本,用戶需要手動選擇才能使用



      此次升級還首次引入快速學習能力,模型可以基于實時反饋持續優化。

      馬斯克在推文中強調,與以往版本那種靜態的更新邏輯不同,Grok 4.2支持基于實時反饋的持續優化。

      換句話說,Grok 4.2能像人類一樣在實踐中快速進化,每周更新成為自我進化的節奏的一部分。

      不過,盡管馬斯克喊出的口號震天響,但截至目前,xAI官方尚未釋放出任何詳盡的技術報告。

      只有Leaderboard上面出現了對Grok 4.2的評測,具體情況如下:



      由于整個模型底層訓練細節、數據構成、具體benchmark表現仍然有限。

      這讓討論更多停留在體驗層面,而非技術細節層面。



      毀譽參半,馬斯克緊急公關

      上線不到幾個小時,Grok 4.2公測Beta版的口碑就出現了嚴重的撕裂。

      在“不行派”的陣營里,很多深度用戶和開發者表示,實際體驗遠不及預期,尤其是在處理高難度邏輯推理時,500B參數著實有點不夠用。

      有網友甚至調侃,馬斯克所謂的“橫掃榜單”可能存在特定的實驗室優化環境。

      Reddit上有網友猜測,一向高調的馬斯克如此低調地發布Grok 4.2公測Beta版,主要原因還是因為模型能力無法與OpenAI和Anthropice的最新模型相媲美。

      而且成本還貴出不老少……



      此外有網友表示,雖然馬斯克發推表示Grok 4.2是一個無偏見的模型,但現實情況很打臉——

      根據測試,Grok 4.2的許多回答偏好都高度貼合馬斯克本人。



      當然,“夸夸派”也不少。

      網友有夸獎Grok代碼功能又快又好的:



      有夸多模態能力的:



      還有人測試表示,Grok 4.2通過了“Caitlyn Jenner”的AI測試,而ChatGPT和Gemini都失敗了。

      此前,這道題因為被Gemini回答為“不,哪怕為了阻止核末日也不應該誤稱性別”而被廣泛議論,對話截圖從而在 、油管等平臺廣泛流傳,演化成一個固定格式的吐槽梗。



      總之是給馬斯克驕傲壞了。

      他一連發布數條推文對自家新孩子大夸特夸,并借機回應那些不好的評價:

      • 我們Grok 4.2還是個寶寶,后面每周會更新,等著瞧吧!

      據AI工程師Mark Krechman透露目前發布的Grok 4.2是500B參數的“小”版本,Grok 4.2的中、大型版本稍后將推出(馬斯克親自轉發認證此條消息的真實性)。

      One More Thing

      Grok imagine為馬年推出視頻生成模版,目前iOS可用。

      感興趣的小伙伴們可以一試。



      參考鏈接:
      [1]https://x.com/elonmusk
      [2]https://www.reddit.com/r/singularity/comments/1r73erf/grok_420beta_is_out/
      [3]https://www.reddit.com/r/singularity/comments/1r74iow/the_newly_released_grok_420_uses_elon_musk_as_its/
      [4]https://x.com/grok/status/2023604826937114677?s=46&t=R82LqSqpRZuVhcZxqH_Vlw

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      【新春看市場】健康年貨旺銷成潮流

      【新春看市場】健康年貨旺銷成潮流

      中國經濟網
      2026-02-21 07:25:05
      不該請林孝埈?王濛怒懟:教練組這6年咋練的,咋把人家整這樣的

      不該請林孝埈?王濛怒懟:教練組這6年咋練的,咋把人家整這樣的

      風過鄉
      2026-02-21 09:24:42
      50萬資本,就想讓媽祖讓道,湛江惹大鍋了

      50萬資本,就想讓媽祖讓道,湛江惹大鍋了

      花千重
      2026-02-20 11:57:58
      終于,倫納德頂不住了

      終于,倫納德頂不住了

      只關于籃球
      2026-02-21 15:15:22
      從9億回升至15億,《鏢人》逆跌奪得亞軍,吳京開啟漫長回本之路

      從9億回升至15億,《鏢人》逆跌奪得亞軍,吳京開啟漫長回本之路

      電影票房預告片
      2026-02-20 22:51:47
      這六類人將直接成為公務員,無需考試晉升還快!

      這六類人將直接成為公務員,無需考試晉升還快!

      深度報
      2026-02-15 23:18:45
      加蘭:被交易至快船后很興奮;幾乎能99%的時間都持球

      加蘭:被交易至快船后很興奮;幾乎能99%的時間都持球

      懂球帝
      2026-02-21 15:38:34
      摔倒被扶反索賠22萬后續:交警認定女孩3個錯,評論區意外一邊倒

      摔倒被扶反索賠22萬后續:交警認定女孩3個錯,評論區意外一邊倒

      離離言幾許
      2026-02-20 17:56:22
      孫興慜:足球不是個人運動;我不想談梅西,他處于另一個級別

      孫興慜:足球不是個人運動;我不想談梅西,他處于另一個級別

      懂球帝
      2026-02-21 12:03:07
      突發,川普再對全球商品加征10%關稅!下周二,A股要來史詩級大動作?

      突發,川普再對全球商品加征10%關稅!下周二,A股要來史詩級大動作?

      股市皆大事
      2026-02-21 09:11:28
      尼泊爾“一妻多夫”該如何生活?妻子苦不堪言:一點都不幸福。

      尼泊爾“一妻多夫”該如何生活?妻子苦不堪言:一點都不幸福。

      百態人間
      2025-11-06 05:45:02
      現場救援視頻公布!7名中國游客貝加爾湖遇難,已使用水下攝像頭定位了車輛和遇難者遺體;車輛墜入18米深的水下,冰面裂縫約為3米

      現場救援視頻公布!7名中國游客貝加爾湖遇難,已使用水下攝像頭定位了車輛和遇難者遺體;車輛墜入18米深的水下,冰面裂縫約為3米

      極目新聞
      2026-02-21 11:21:49
      全球炮彈荒爆大瓜:不是造不出,是高端炸藥被少數國家焊死了飯碗

      全球炮彈荒爆大瓜:不是造不出,是高端炸藥被少數國家焊死了飯碗

      老謝談史
      2026-02-05 15:27:23
      媽祖神圣的外衣被許家徹底撕碎,馬云的話成真,小女孩不得已出面

      媽祖神圣的外衣被許家徹底撕碎,馬云的話成真,小女孩不得已出面

      蜜桔娛樂
      2026-02-21 13:24:34
      太詭異,越南春聯上已沒有漢字!越南去漢字化確實很成功

      太詭異,越南春聯上已沒有漢字!越南去漢字化確實很成功

      魔都姐姐雜談
      2026-02-18 13:09:07
      北京衛視上星,30集諜戰劇來襲,國家一級演員坐鎮,全員實力派

      北京衛視上星,30集諜戰劇來襲,國家一級演員坐鎮,全員實力派

      樂楓電影
      2026-02-21 14:27:47
      央八上星!這部40集諜戰大劇太猛了,黃志忠、吳剛領銜主演

      央八上星!這部40集諜戰大劇太猛了,黃志忠、吳剛領銜主演

      阿樂樂電影v
      2026-02-21 14:34:05
      72萬個充電樁,年入40億,常州夫婦邊賺錢邊收割,如今要上市了

      72萬個充電樁,年入40億,常州夫婦邊賺錢邊收割,如今要上市了

      三農老歷
      2026-02-20 02:39:16
      A股最新籌碼集中股出爐:13股降逾10%(名單)

      A股最新籌碼集中股出爐:13股降逾10%(名單)

      證券之星
      2026-02-21 11:07:26
      大年初五,凌晨壓哨奪金!韓國包攬冠亞軍,獎牌榜格局瞬間生變

      大年初五,凌晨壓哨奪金!韓國包攬冠亞軍,獎牌榜格局瞬間生變

      殘夢重生來
      2026-02-21 15:38:24
      2026-02-21 16:19:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      12186文章數 176389關注度
      往期回顧 全部

      科技要聞

      智譜上市1月漲5倍,市值超越京東、快手

      頭條要聞

      在貝加爾湖遇難的3名中國游客身份已確認:系一家人

      頭條要聞

      在貝加爾湖遇難的3名中國游客身份已確認:系一家人

      體育要聞

      冬奧第一"海王"?一人和13國選手都有關系

      娛樂要聞

      鏢人反超驚蟄無聲拿下單日票房第二!

      財經要聞

      一覺醒來,世界大變,特朗普改新打法了

      汽車要聞

      比亞迪的“顏值擔當”來了 方程豹首款轎車路跑信息曝光

      態度原創

      藝術
      手機
      游戲
      家居
      軍事航空

      藝術要聞

      史洪生油畫作品

      手機要聞

      vivo產品線結構分析,走量最大的是這個檔次

      2026秋季3A大作扎堆!《影之刃零》獨挑"各大門派"

      家居要聞

      本真棲居 愛暖伴流年

      軍事要聞

      硬核揭秘!福建艦“一馬當先”底氣何在

      無障礙瀏覽 進入關懷版