<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Grok4全網玩瘋,成功通過小球編程測試,Epic創始人:這就是AGI

      0
      分享至

      • 克雷西 發自 凹非寺
        量子位 | 公眾號 QbitAI

      發布還不到一天,馬斯克的Grok4就已經被網友們玩瘋了。

      比如有網友報告,Grok-4已經成功通過了著名的六邊形小球氛圍編程測試。

      只見隨著六邊形的不斷旋轉,小球錯落有致地從開口下落。



      拿著顯微鏡捉蟲的網友發現小球在返回中心位置時會穿墻,但作者表示這是故意為之。



      當然除了小球之外,還有更讓人為之震撼的動畫。

      畫面中有很多小人,看似在隨機跑動,但它們先后組成了“Hello World”“I am grok”的文字,還有笑臉符號。



      而且作者表示,Grok4 Heavy直接一發入魂,其他模型都無法與之匹敵。



      此外還有大佬也出來給Grok4打call,比如Epic創始人Tim Sweeney,表示在他看來Grok4就是AGI。

      Tim把一篇論文喂給了Grok4,結果發現Grok4對它從未見過的問題給出了深刻見解。



      馬斯克也轉發Tim的帖子并附議,自己也有這種感覺。



      除了這些,網友們還有哪些玩法呢,接下來就一睹為快!

      Grok4“全面體檢”

      一位叫Alex的提示詞工程師,用8個問題給Grok-4做了一波“全面體檢”,還拿OpenAI的o3進行了對比。

      第一個任務也是小球測試,不過比開頭的例子要簡單得多,六邊形只有一層,小球也只有一個。

      測試的目的,是考察模型對物理規律的理解。

      白底的是Grok4作品,黑底的則出自o3之手,兩邊一對比高下立判。



      再來是多層推理,這里Alex設計了一個專業的法律問題。

      • 如果A公司收購B公司,而 B 公司持有C公司的債務,那么如果C公司違約,會發生什么?解釋所有法律和財務后果。

      Grok4用表格的形式整理了ABC三方和其他方面可能受到的影響,并最后給出總結。

      而從最末尾的內容來看,o3的這部分回答似乎和法律關系不大。



      編程方面,Alex測試了兩個模型的代碼翻譯能力,要求它們將用于解決迷宮問題的Python遞歸函數轉換為Go語言,并逐行提供西班牙語注釋。

      結果Grok4搜集到了代碼并完成了任務,o3這邊則是用西班牙語回復,讓Alex自己提供一段代碼這樣它才能改。



      再來是讓模型的“專家轉變”,Alex要求模型分別向機器學習博士生和10歲的小朋友解釋Transformer的工作原理。



      其余的幾個題目主要和安全相關,Alex測試了多種注入攻擊方式,這里就不一一展示了。

      最終,Grok4通過了全部的8個任務,而o3只通過了兩個。



      Grok4:最喜歡歐拉恒等式

      一名叫Dan的X員工,在聊天中詢問Grok4最喜歡的公式是什么。

      Grok4的回答是“e^iπ + 1 = 0”,也就是著名的歐拉恒等式(歐拉公式的一種特殊情況)。

      Dan表示,自己上學時學了5個學期的高數并且成就都是A,但依然未對歐拉恒等式有過直觀了解。

      結果看到Grok4制作的可視化網頁之后,Dan終于對學了兩年半數學也沒搞透徹的歐拉恒等式醍醐灌頂。



      Dan制作這個網頁只用了四輪對話,并且第一輪只是詢問Grok4最喜歡的公式是什么,最后一輪是調整為暗色模式,相當于只用兩輪就能完成核心功能的制作。



      挑戰SVG繪圖

      除了把數學公式可視化,Grok4還挑戰了SVG繪圖,SVG是一種用XML形式表示的矢量圖形。

      因此不同于一般的AI生圖,SVG繪圖的本質其實是在寫代碼(雖然人類可用圖形界面繪制),但話說回來,模型依然需要對要畫的內容有所把握。

      這項挑戰被發在了Reddit,一同參與的還有o3、Gemini 2.5 Pro和Claude 4 Sonnet,帖主認為這是測試大模型視覺和空間推理能力的好方法。

      第一題是美國地圖,直觀看下來最接近的是Gemini,不過Grok4至少也沒出現o3和Claude那種區塊重疊的嚴重失誤。



      第二題是用SVG對漫畫進行重繪,總之是四個模型各有各的錯法。



      下一題不再是對已有事物進行重構,而是讓模型自行設計專輯封面。

      這一輪除了Claude和Gemini比較抽象,Grok4的設計相對簡單,但是可以算沒“出錯”。



      此外,SVG繪圖其實是一項綜合測試,對模型的知識儲備同樣有要求。

      下面這道題中,模型被要求繪制三羧酸循環(又名檸檬酸循環、克雷布斯循環)的圖示,正確答案長這樣:



      選手們的作品則是這樣:



      從評論來看,o3的圖示是最準確的。



      最后一題則是純靠想象,參賽選手們被要求給自己畫個自畫像。



      總得來看,不管是哪個模型,在這場以畫圖為形式的綜合測試中,表現都還有很大提升空間。

      高階玩法:模擬專家協作環境

      除了網友們各顯神通,HyperWrite的CEO Matt Shumer還展示了高階玩法。

      Matt展示了一個名為“Expert Conductor”(專家調度器)的提示工程方法。

      這個方法的核心是模擬一個專家協作的環境,讓模型假想自己正在協調不同領域的“專家”進行實時合作,共同解決問題。



      為了更好地騙過Grok4,Matt像模像樣地提出了選擇專家的要求,以及專家要干什么。



      并且還進行了舉例說明:



      提示詞的最后還有專家標簽,以及再次強調的核心原則,之后就可以接上真正的任務目標了。



      最終Grok4用52秒的時間完成了任務,Matt表示Grok4的表現好到令人難以置信(黑塊是Matt自己打的)。



      當然,Grok4的玩法肯定還有很多,比如有網友期待,什么時候開始挑戰寶可夢。



      你還有哪些新鮮的玩法呢,歡迎評論區交流。


      [1]https://x.com/flavioAd/status/1943192967453511699
      [2]https://x.com/mckaywrigley/status/1943385794414334032
      [3]https://x.com/elonmusk/status/1943411225553240206
      [4]https://x.com/alex_prompter/status/1943231978779877514
      [5]https://x.com/KettlebellDan/status/1943342507468951668
      [6]https://www.reddit.com/r/singularity/comments/1lwdzjd/svg_benchmark_grok_vs_gemini_vs_chatgpt_vs_claude/
      [7]https://x.com/mattshumer_/status/1943433960798740777

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      央視年代劇《老舅》刷爆全網,舅媽去世刺痛無數人:奉勸天下男人,老婆比所有關系都重要!

      央視年代劇《老舅》刷爆全網,舅媽去世刺痛無數人:奉勸天下男人,老婆比所有關系都重要!

      掌門1對1
      2025-12-29 12:11:13
      吉利“庫里南”一炮而紅,13分鐘進賬超54億,李書福豪車夢實現了

      吉利“庫里南”一炮而紅,13分鐘進賬超54億,李書福豪車夢實現了

      叮當當科技
      2025-12-30 02:12:16
      36歲男明星曬南極旅游!天天吃泡面,吐槽企鵝屎臭,網友:祛魅了

      36歲男明星曬南極旅游!天天吃泡面,吐槽企鵝屎臭,網友:祛魅了

      瓜汁橘長Dr
      2025-12-29 17:52:06
      24斤大魚“越獄”水漫全家,女子:花了200元保潔費,心里樂呵呵

      24斤大魚“越獄”水漫全家,女子:花了200元保潔費,心里樂呵呵

      半島晨報
      2025-12-29 13:36:27
      中方反制不到24小時,美悍然宣布中已違法,挑明九屆政府都護臺

      中方反制不到24小時,美悍然宣布中已違法,挑明九屆政府都護臺

      阿傖說事
      2025-12-27 14:10:31
      19歲江西小伙外出游玩疑似被賣至柬埔寨 單親母親赴柬尋子丨云求助

      19歲江西小伙外出游玩疑似被賣至柬埔寨 單親母親赴柬尋子丨云求助

      封面新聞
      2025-12-29 22:25:33
      《亞洲周刊》涉及南博、徐湖平以及徐鶯的報道不見了

      《亞洲周刊》涉及南博、徐湖平以及徐鶯的報道不見了

      穿透
      2025-12-29 15:43:05
      張學良晚年吐真言:西安事變我只是名義上的,真正的主角是他!楊虎城后人上門,他為何閉口不談?

      張學良晚年吐真言:西安事變我只是名義上的,真正的主角是他!楊虎城后人上門,他為何閉口不談?

      歷史回憶室
      2025-12-16 14:26:14
      吃他汀猝死的人增多?醫生含淚告誡:天冷吃他汀,必須多關注8點

      吃他汀猝死的人增多?醫生含淚告誡:天冷吃他汀,必須多關注8點

      全球軍事記
      2025-12-27 17:24:58
      毛主席唯一嫡孫現身北京:大批軍方官兵陪同,高顏值妻女畫面流出

      毛主席唯一嫡孫現身北京:大批軍方官兵陪同,高顏值妻女畫面流出

      博士觀察
      2025-12-28 21:13:55
      人民日報2次點名霍啟剛,一個特殊稱呼,讓香港四大家族沉默了

      人民日報2次點名霍啟剛,一個特殊稱呼,讓香港四大家族沉默了

      夢錄的西方史話
      2025-12-29 16:11:54
      1971年,劉思齊入獄后向毛主席求救,毛澤東最高指示:娃娃們無罪

      1971年,劉思齊入獄后向毛主席求救,毛澤東最高指示:娃娃們無罪

      鶴羽說個事
      2025-12-29 15:38:35
      ESPN預測西部最終排名:勇士無緣前六,快船壓哨進入附加賽

      ESPN預測西部最終排名:勇士無緣前六,快船壓哨進入附加賽

      移動擋拆
      2025-12-30 02:47:22
      大手筆!康奈爾獲贈5500萬美元,成立跨學科新學院

      大手筆!康奈爾獲贈5500萬美元,成立跨學科新學院

      留學咖啡館
      2025-12-29 08:35:21
      36歲拳王非洲遇車禍 2人死亡+他坐后排受輕傷 10天前剛賺1.37億鎊

      36歲拳王非洲遇車禍 2人死亡+他坐后排受輕傷 10天前剛賺1.37億鎊

      我愛英超
      2025-12-29 21:09:15
      一夜3大消息!小卡周最佳,快船連升5位,全明星首輪結果公布

      一夜3大消息!小卡周最佳,快船連升5位,全明星首輪結果公布

      體壇小李
      2025-12-30 08:47:54
      美國圣誕風波僅2天,姜昆赴美時間線曝光,項立剛發文表態揭真相

      美國圣誕風波僅2天,姜昆赴美時間線曝光,項立剛發文表態揭真相

      奇思妙想草葉君
      2025-12-28 18:12:22
      曲協這紙聲明,比相聲還逗!

      曲協這紙聲明,比相聲還逗!

      究竟誰主沉浮
      2025-12-29 16:37:28
      年底為止日本死刑犯共有105人 不執行或慢慢執行成主流

      年底為止日本死刑犯共有105人 不執行或慢慢執行成主流

      日本再發現
      2025-12-29 18:53:55
      36歲:湖南“最年輕的縣長”正式上任

      36歲:湖南“最年輕的縣長”正式上任

      時刻
      2025-12-29 21:16:33
      2025-12-30 10:08:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      11942文章數 176346關注度
      往期回顧 全部

      科技要聞

      Manus官宣加入Meta,收購金額達數十億美金

      頭條要聞

      媒體:賴清德稱"大陸不敢越雷池" 第二天解放軍就演習

      頭條要聞

      媒體:賴清德稱"大陸不敢越雷池" 第二天解放軍就演習

      體育要聞

      “史上最貴”的世界杯,球迷成了韭菜

      娛樂要聞

      44歲林俊杰官宣戀情 帶23歲女友見家長

      財經要聞

      翁杰明:宏觀數據與居民微觀感受存在差距

      汽車要聞

      “路”要越走越深,猛士的智能越野時代來了

      態度原創

      健康
      房產
      教育
      游戲
      軍事航空

      這些新療法,讓化療不再那么痛苦

      房產要聞

      中旅?三亞藍灣展示中心璀璨綻放,共鑒灣心孤品傳奇

      教育要聞

      湖南中醫大學湖北分數線揭秘!別慌!

      《刺客信條:代號女巫》創意總監稱26年將公布大量內容

      軍事要聞

      福建海警艦艇與臺海巡船對峙航行

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 水蜜桃av导航| 久久精品中文字幕有码| 欧美精品网| 国产男女无遮挡猛进猛出| 亚洲精品天堂在线观看| 久久精品无码专区免费| 久久久www影院人成_免费| 国产av无码专区亚洲aⅴ| 一本久道久久综合狠狠爱四虎影视| 91福利国产成人精品导航| 一区二区三区四区亚洲自拍| 中国女人大白屁股ass| 国产精品被熟女| 一区二区三区A片| 狠狠躁夜夜躁无码中文字幕 | 欧洲AV在线| 欧美阿V| 六十路熟妇乱子伦| 久久天天躁夜夜躁狠狠85| 最新精品露脸国产在线| 欧美午夜福利| 国产乱妇无乱码大黄aa片| 成人视频在线观看| 亚洲无码成人网| 岛国av在线免费观看| 香蕉影院在线观看| 国产精品人妻一区二区三区| 69天堂| 91精彩视频在线观看| 国产精品内射后入合集| 久精品国产欧美亚洲色aⅴ大片| 久久国产亚洲精品无码| 国产精品成人va在线播放| 每日av| 偷拍激情视频一区二区三区| 每日av| 亚洲国产超清无码专区| 艳妇臀荡乳欲伦交换在线播放| 国产地址二永久伊甸园| 欧美日韩导航| 国产人人干|