<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      毀三觀!被中國研究員扒出AI 論文造假后,蘋果竟然直接刪庫跑路了!

      0
      分享至

      ICLR 2026 (國際學術表征會議)將于明年 4 月在巴西里約熱內盧召開。目前(11 月11 日—12月3 日 )為論文的作者-評審階段。

      最近,這個國際頂級 AI 會議,爆出了個“讓業界都震驚了”的大丑聞。

      征集階段,蘋果研究團隊提交了一篇論文,標題為《推理究竟哪里出錯了?》(Where Did the Reasoning Go Wrong?) 。


      這篇論文提出名為 PRISM-Bench 的基準測試,稱能專門檢測多模態大模型在推理時的第一處錯誤。


      論文被上海“階躍星辰”研究員 Lei yang看到后,他把階躍星辰模型適配到 Benchmark 上做了實驗。

      結果,他發現自家模型跑分,低得離譜。

      于是,他開始排查自己的集成方式,但在查閱 Apple 官方代碼時,他看到了一個震碎三觀的低級 Bug

      在調用視覺語言模型進行推理時,本該傳入圖片像素數據,代碼卻錯誤地只傳了圖片的存儲路徑字符串。

      也就是說,模型壓根沒看到圖,只是讀到了一行類似“D盤/圖片/01.jpg”的文字


      于是, Lei Yang 順手改了 Bug,還把真正的圖片傳了進去。

      結果,分數反而更低了。

      這意味著,在蘋果公司提交的這個 Benchmark 里,模型瞎蒙的效果,比實際看圖還要好

      也就是說,其數據集本身存在巨大的邏輯漏洞,或者更可能的是,純粹是為了湊數的擺設。

      帶著這個懷疑, Lei Yang 決定放棄代碼,直接人工檢查數據。

      他隨機選擇了模型答錯的前20道題,結果,有 6 個題的標準答案本身就是錯的

      真是震碎了三觀!

      就此, Lei Yang在 GitHub 上認真提交了一個問題反饋。

      沒想到,接下來 Apple 作者團隊的操作,讓人大跌眼鏡。

      6 天后,他們敷衍的給出了一個簡短回復,然后,然后,就連夜撤稿,刪庫跑路了!



      之后,Lei Yang 提出強烈抗議,他們才又不得不重新恢復。

      被蘋果式傲慢激怒的Lei Yang,最后選擇了將這一丑聞公之于眾。


      他用“可怕的錯誤”來形容蘋果論文的 bug,公布了 20 道題的測試文件,還表示,這些示例的“真實推理過程”也包含大量幻覺和錯誤。

      比如,在論文附錄的 Figure 11 里,題目要求找一條直線和一條曲線,圖里明明是相切,AI 生成的“正確推理”,卻說這一步錯了,理由是“這圖里展示的是相交” 。


      更吊詭的是,有網友查詢蘋果論文原文發現,在第 4 頁上煞有介事的寫著,“所有的思維鏈都經過標注員審查,以確保……錯誤位置清晰明確”。


      簡直是自欺欺人!

      還有更恐怖的。在該論文的 Table 2 中,作者列出了一大堆模型在這個 Benchmark 上的跑分。比如,GPT-5 跑了 52.6%,Qwen2.5-VL 跑了 57.0%。


      這些精確到小數點后一位的分數,到底是怎么跑出來的?!!!

      除了蘋果公司本身的不靠譜,還可以繼續追問的是,這篇論文有 5 位審稿人,而論文發表的場合 ICLR,更是AI 界的頂級會議。這些評審都在做啥?

      我們來看看審稿人們的評價。


      這位審稿人評價為Soundness: 4 excellent(可靠性:極佳)的評價。


      這位審稿人的評價是Soundness: 3 good(可靠性:3 良好),并稱其“提供了詳細的復現細節”。

      這顯然與Lei Yang的復現結果大相徑庭,這位評審真的去認真復現了么?

      有網友揭秘稱,蘋果從2023年開始,每年發一篇實際上并不靠譜的論文,詆毀大模型。

      比如,2023 年的《ReLU 強勢回歸:利用大語言模型的激活稀疏性》,2024 年的

      《GSM?Symbolic:理解大語言模型在數學推理中的局限性》。

      開始時,還有很多人叫好,去年開始受到不少質疑,沒想到今年就翻車了,而且還這么徹底。

      沒想到高大上的蘋果公司,還有 AI 頂級學術界,也會“草臺班子”如此。

      幸好還有來自中國上海 AI 公司階躍星辰的這位較真的Lei Yang!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      28歲川大博士在意大利失聯新線索浮現,目擊者稱見疑似其身影

      28歲川大博士在意大利失聯新線索浮現,目擊者稱見疑似其身影

      寶哥精彩賽事
      2026-02-25 08:24:18
      1萬個避孕套3天秒空!冬奧組委會汗流浹背了

      1萬個避孕套3天秒空!冬奧組委會汗流浹背了

      品牌營銷報
      2026-02-25 09:24:20
      恭喜曼聯!重現“德赫亞+羅梅羅”豪華配置,紅魔迎門將青春風暴

      恭喜曼聯!重現“德赫亞+羅梅羅”豪華配置,紅魔迎門將青春風暴

      體壇鑒春秋
      2026-02-25 13:54:29
      本科已嚴重飽和的五個專業,1、臨床醫學,2、法學,3、計算機

      本科已嚴重飽和的五個專業,1、臨床醫學,2、法學,3、計算機

      明智家庭教育
      2026-01-31 10:29:14
      日本博主吐槽便當與宣傳圖不符!炸出網友集體曬“包裝照騙”,日本人破防:原來不止我被坑!

      日本博主吐槽便當與宣傳圖不符!炸出網友集體曬“包裝照騙”,日本人破防:原來不止我被坑!

      東京新青年
      2026-02-24 17:46:14
      收評:全股民做好準備!A股變盤點來了,不出意外明天將這樣走

      收評:全股民做好準備!A股變盤點來了,不出意外明天將這樣走

      財經大拿
      2026-02-25 13:40:13
      45歲薛凱琪春晚“水蛇腰”炸場,網友:方大同走了,她不會結婚了

      45歲薛凱琪春晚“水蛇腰”炸場,網友:方大同走了,她不會結婚了

      她時尚丫
      2026-02-23 22:11:00
      官宣!遼足名宿之子,18歲1米9前鋒,離開遼寧鐵人,加盟伯恩利

      官宣!遼足名宿之子,18歲1米9前鋒,離開遼寧鐵人,加盟伯恩利

      小金體壇大視野
      2026-02-25 15:02:59
      真正生理性的喜歡,根本藏不住!不是接吻和擁抱,而是……

      真正生理性的喜歡,根本藏不住!不是接吻和擁抱,而是……

      青蘋果sht
      2026-02-22 06:58:00
      中方投了棄權票

      中方投了棄權票

      第一財經資訊
      2026-02-25 11:22:55
      痛心!海南一民警因公殉職,生命定格在50歲

      痛心!海南一民警因公殉職,生命定格在50歲

      蓬勃新聞
      2026-02-25 14:37:52
      女護士處理男患者隱私部位,會感覺難為情嗎?美女護士說出大實話

      女護士處理男患者隱私部位,會感覺難為情嗎?美女護士說出大實話

      第7情感
      2025-09-17 12:12:15
      2月24日俄烏最新:戰爭的天平開始傾斜

      2月24日俄烏最新:戰爭的天平開始傾斜

      西樓飲月
      2026-02-24 21:37:50
      澳大利亞驚現封閉亂倫家族:4代人近親繁衍38名成員全是亂倫產物

      澳大利亞驚現封閉亂倫家族:4代人近親繁衍38名成員全是亂倫產物

      第7情感
      2026-02-23 20:45:16
      中國男籃,郭士強任命新一任隊長

      中國男籃,郭士強任命新一任隊長

      體育哲人
      2026-02-24 20:23:42
      OpenClaw刪光Meta安全總監郵箱!連喊3次停手都沒用,她狂奔去拔網線

      OpenClaw刪光Meta安全總監郵箱!連喊3次停手都沒用,她狂奔去拔網線

      新智元
      2026-02-24 12:33:20
      “茶幾”正在退出中國家庭,學廣東人這樣做,實用性讓人大開眼界

      “茶幾”正在退出中國家庭,學廣東人這樣做,實用性讓人大開眼界

      室內設計師有料兒
      2026-02-19 11:17:18
      平頂山打人事件的二次通報,看完讓人后背發涼

      平頂山打人事件的二次通報,看完讓人后背發涼

      清書先生
      2026-02-25 17:01:07
      小米昆侖旗艦SUV全新預測圖曝光 采用豎條式鍍鉻格柵

      小米昆侖旗艦SUV全新預測圖曝光 采用豎條式鍍鉻格柵

      CNMO科技
      2026-02-24 10:02:12
      造不出就買!260 億吞下美國打印機巨頭,珠海破解暴利壟斷

      造不出就買!260 億吞下美國打印機巨頭,珠海破解暴利壟斷

      知識TNT
      2026-02-24 12:30:09
      2026-02-25 18:32:49
      AI先鋒官 incentive-icons
      AI先鋒官
      AIGC大模型及應用精選與評測
      437文章數 60關注度
      往期回顧 全部

      科技要聞

      “機器人只跳舞,沒什么用”

      頭條要聞

      女子被害留下3個女兒無人照顧 辦案警察接力資助15年

      頭條要聞

      女子被害留下3個女兒無人照顧 辦案警察接力資助15年

      體育要聞

      曝雄鹿計劃今夏追小卡 字母哥渴望與其并肩作戰

      娛樂要聞

      撒貝寧到沈陽跑親戚 老婆李白模特身材

      財經要聞

      GEO亂象:誰為AI營銷的泡沫買單?

      汽車要聞

      750km超長續航 2026款小鵬X9純電版將于3月2日上市

      態度原創

      家居
      藝術
      親子
      本地
      公開課

      家居要聞

      藝居辦公 溫度與效率

      藝術要聞

      這位藝術家的馬賽克畫讓人驚嘆不已!

      親子要聞

      如何幫娃建立專注力持久性?

      本地新聞

      津南好·四時總相宜

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版