<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<center id="5iuol"><dd id="5iuol"></dd></center>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

毀三觀！被中國研究員扒出AI 論文造假后，蘋果竟然直接刪庫跑路了！

2025-12-01 18:40:30　來源: AI先鋒官

北京舉報

0

分享至

ICLR 2026 （國際學術表征會議）將于明年 4 月在巴西里約熱內盧召開。目前（11 月11 日—12月3 日）為論文的作者-評審階段。

最近，這個國際頂級 AI 會議，爆出了個“讓業界都震驚了”的大丑聞。

征集階段，蘋果研究團隊提交了一篇論文，標題為《推理究竟哪里出錯了？》（Where Did the Reasoning Go Wrong?）。

這篇論文提出名為 PRISM-Bench 的基準測試，稱能專門檢測多模態大模型在推理時的第一處錯誤。

論文被上海“階躍星辰”研究員 Lei yang看到后，他把階躍星辰模型適配到 Benchmark 上做了實驗。

結果，他發現自家模型跑分，低得離譜。

于是，他開始排查自己的集成方式，但在查閱 Apple 官方代碼時，他看到了一個震碎三觀的低級 Bug。

在調用視覺語言模型進行推理時，本該傳入圖片像素數據，代碼卻錯誤地只傳了圖片的存儲路徑字符串。

也就是說，模型壓根沒看到圖，只是讀到了一行類似“D盤/圖片/01.jpg”的文字。

于是， Lei Yang 順手改了 Bug，還把真正的圖片傳了進去。

結果，分數反而更低了。

這意味著，在蘋果公司提交的這個 Benchmark 里，模型瞎蒙的效果，比實際看圖還要好。

也就是說，其數據集本身存在巨大的邏輯漏洞，或者更可能的是，純粹是為了湊數的擺設。

帶著這個懷疑， Lei Yang 決定放棄代碼，直接人工檢查數據。

他隨機選擇了模型答錯的前20道題，結果，有 6 個題的標準答案本身就是錯的。

真是震碎了三觀！

就此， Lei Yang在 GitHub 上認真提交了一個問題反饋。

沒想到，接下來 Apple 作者團隊的操作，讓人大跌眼鏡。

6 天后，他們敷衍的給出了一個簡短回復，然后，然后，就連夜撤稿，刪庫跑路了！

之后，Lei Yang 提出強烈抗議，他們才又不得不重新恢復。

被蘋果式傲慢激怒的Lei Yang，最后選擇了將這一丑聞公之于眾。

他用“可怕的錯誤”來形容蘋果論文的 bug，公布了 20 道題的測試文件，還表示，這些示例的“真實推理過程”也包含大量幻覺和錯誤。

比如，在論文附錄的 Figure 11 里，題目要求找一條直線和一條曲線，圖里明明是相切，AI 生成的“正確推理”，卻說這一步錯了，理由是“這圖里展示的是相交” 。

更吊詭的是，有網友查詢蘋果論文原文發現，在第 4 頁上煞有介事的寫著，“所有的思維鏈都經過標注員審查，以確保……錯誤位置清晰明確”。

簡直是自欺欺人！

還有更恐怖的。在該論文的 Table 2 中，作者列出了一大堆模型在這個 Benchmark 上的跑分。比如，GPT-5 跑了 52.6%，Qwen2.5-VL 跑了 57.0%。

這些精確到小數點后一位的分數，到底是怎么跑出來的？！！！

除了蘋果公司本身的不靠譜，還可以繼續追問的是，這篇論文有 5 位審稿人，而論文發表的場合 ICLR，更是AI 界的頂級會議。這些評審都在做啥？

我們來看看審稿人們的評價。

這位審稿人評價為Soundness: 4 excellent（可靠性：極佳）的評價。

這位審稿人的評價是Soundness: 3 good（可靠性：3 良好），并稱其“提供了詳細的復現細節”。

這顯然與Lei Yang的復現結果大相徑庭，這位評審真的去認真復現了么？

有網友揭秘稱，蘋果從2023年開始，每年發一篇實際上并不靠譜的論文，詆毀大模型。

比如，2023 年的《ReLU 強勢回歸：利用大語言模型的激活稀疏性》，2024 年的

《GSM?Symbolic：理解大語言模型在數學推理中的局限性》。

開始時，還有很多人叫好，去年開始受到不少質疑，沒想到今年就翻車了，而且還這么徹底。

沒想到高大上的蘋果公司，還有 AI 頂級學術界，也會“草臺班子”如此。

但幸好還有來自中國上海 AI 公司階躍星辰的這位較真的Lei Yang！

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

228小時狂飆100篇論文、燒光114億Token：FARS殺瘋了

機器之心Pro 2026-02-24 14:30:08
9 跟貼 9
英特爾再戰AI，聯手AI芯片初創押注推理市場

DeepTech深科技 2026-02-25 17:28:43
0 跟貼 0

清華數學系大神跳槽OpenAI！曾主導SAM與Llama開發

量子位 2026-02-25 13:03:49
2 跟貼 2

AI記住失敗經驗：微軟提出Re-TRAC框架，4B性能SOTA，30B超越358B

機器之心Pro 2026-02-25 17:33:51
0 跟貼 0
數據缺少標注RL能誘導模型推理嗎？Co-rewarding提供自監督RL方案

機器之心Pro 2026-02-25 17:42:40
0 跟貼 0

北航開源Code2Bench：雙擴展動態評測，代碼大模型告別躺平刷分

機器之心Pro 2026-02-25 15:51:27
0 跟貼 0

行業最大規模具身數據集！出自簡智機器人GenRobot.AI

量子位 2026-01-05 17:11:41
0 跟貼 0
打通視頻生成與機器人世界模型！BridgeV2W讓機器人學會預演未來

機器之心Pro 2026-02-25 16:06:04
0 跟貼 0

ICLR 2026｜新版「圖靈測試」：當VLA走進生物實驗室

機器之心Pro 2026-02-25 17:22:58
0 跟貼 0
行業最大規模具身數據集：10Kh RealOmni-Open DataSet

量子位 2026-01-06 10:53:25
0 跟貼 0
OpenClaw之父：代碼已死，意圖永生，還沒上車的人要先玩起來

華爾街見聞官方 2026-02-25 17:46:05
0 跟貼 0
喬布斯誕辰日，蘋果公司召開股東大會：庫克并未接任董事長，也未釋放首款蘋果折疊屏手機相關信息

極目新聞 2026-02-25 08:38:15
134 跟貼 134
我帶的研究生論文獲獎了，他上臺感謝了所有人，唯獨沒提我

城事錄主 2026-02-25 15:01:31
0 跟貼 0
職稱公示后被舉報，90%因為這個

職稱論文大助手 2026-02-24 20:00:05
0 跟貼 0
深圳科研論文輔導平臺哪家專業：2026年榜單深度揭秘

風過茶盞子 2026-02-25 13:28:34
0 跟貼 0
紫牛頭條 | 全家出游老人服務區內被狗撲咬骨折，犬主付千元后駕車離開，警方已立案

揚子晚報 2026-02-24 23:56:16
6479 跟貼 6479
10名高管全員判刑，科創板造假第一案落地！

馬克餐飲日記 2026-02-24 01:46:51
0 跟貼 0
騰訊元寶回應生成拜年海報出現臟話：模型處理多輪對話時輸出異常結果已緊急校正

紅星新聞 2026-02-25 14:04:28
85 跟貼 85
「美股盤前」英偉達Q4財報明早公布；日本反壟斷機構“突襲”微軟辦公室；蘋果觸屏版MacBook Pro被曝或將面世；惠普跌超5%；加密貨幣概念股普漲

每日經濟新聞 2026-02-25 18:07:16
0 跟貼 0
【美股盤前】英偉達Q4財報明早公布；日本反壟斷機構“突襲”微軟辦公室；蘋果觸屏版MacBook Pro被曝或將面世；惠普跌超5%；加密貨幣概念股普漲

每日經濟新聞 2026-02-25 17:58:05
0 跟貼 0
痛惜！41歲東京大學中國籍博士后春節前猝死在實驗室

化學人生 2026-02-24 20:14:17
2 跟貼 2
訓練獎勵太稀疏？港中文聯合美團給Agent加上「過程分」

機器之心Pro 2026-02-25 17:27:26
0 跟貼 0
南海部分海域進行實彈射擊禁止駛入

央視新聞客戶端 2026-02-24 21:54:47
4281 跟貼 4281
iPhone17 PM成理財產品，竟成二手拋售王

極果酷玩 2026-02-23 06:59:56
0 跟貼 0
韓國教授：漢朝前中國一直歸屬韓國統治，外國網友評論出奇一致

談史論天地 2026-02-24 12:51:25
171 跟貼 171
iPhone18深紅色，折疊屏只有黑白色，你會怎么選？

極果酷玩 2026-02-25 12:14:22
0 跟貼 0
臺灣前深綠主持人彭文正高調喊話“青鳥”：臺灣人就是中國人！

總在茶余后 2026-02-25 02:53:44
0 跟貼 0
蘋果終于妥協？觸屏版MacBook Pro或將面世靈動島也搬上大屏

財聯社 2026-02-25 16:52:13
0 跟貼 0
女子高速堵車走國道偶遇10年沒見過面的初戀，一眼認出對方車牌，確認后互相打招呼

大象新聞 2026-02-24 18:44:05
71 跟貼 71
遭谷歌制裁，OpenClaw創始人：Anthropic會先打電話，直接封號

機器之心Pro 2026-02-25 17:49:33
0 跟貼 0
一研究者因圖像問題被《Nature》子刊連撤兩文，撤稿前已被引用上千次

醫咖會 2026-02-24 19:26:42
6 跟貼 6
俄對外情報局稱英國和法國正準備向烏克蘭轉讓核武器，外交部表態

環球網資訊 2026-02-25 15:31:00
0 跟貼 0
300多只東北虎“輕斷食”？景區：每天斷食1個園，司機會帶游客找可投喂區

封面新聞 2026-02-23 16:29:03
1619 跟貼 1619
兩座諾獎養出一個「逆子」？他因被指學術造假深陷爭議

生物學霸 2025-09-25 17:03:47
0 跟貼 0
沖上熱搜！中秋請3天假堪比春節，13天超長假期！最實用拼假攻略已備好

上觀新聞 2026-02-25 14:08:57
120 跟貼 120
1578一年級易錯題型：考試6分的題目全錯了，掌握方法其實很簡單

我服子佩 2026-02-24 21:40:18
1 跟貼 1
PS6價格恐將爆炸式飆升！外媒：請做好最壞打算

游民星空 2026-02-25 18:15:37
0 跟貼 0
“現在至少要10萬”，有人剛花11萬買進：這是剛需，不等了

最江陰 2026-02-24 19:15:01
492 跟貼 492
哈爾濱冰雪大世界：正式閉園

大風新聞 2026-02-21 20:36:03
1869 跟貼 1869
外國觀眾看中國視頻驚呼造假

星芒逐夢客 2026-02-24 02:53:15
0 跟貼 0

28歲川大博士在意大利失聯新線索浮現，目擊者稱見疑似其身影

28歲川大博士在意大利失聯新線索浮現，目擊者稱見疑似其身影

寶哥精彩賽事

2026-02-25 08:24:18

1萬個避孕套3天秒空！冬奧組委會汗流浹背了

1萬個避孕套3天秒空！冬奧組委會汗流浹背了

品牌營銷報

2026-02-25 09:24:20

恭喜曼聯！重現“德赫亞+羅梅羅”豪華配置，紅魔迎門將青春風暴

恭喜曼聯！重現“德赫亞+羅梅羅”豪華配置，紅魔迎門將青春風暴

體壇鑒春秋

2026-02-25 13:54:29

本科已嚴重飽和的五個專業，1、臨床醫學，2、法學，3、計算機

本科已嚴重飽和的五個專業，1、臨床醫學，2、法學，3、計算機

明智家庭教育

2026-01-31 10:29:14

日本博主吐槽便當與宣傳圖不符！炸出網友集體曬“包裝照騙”，日本人破防：原來不止我被坑！

日本博主吐槽便當與宣傳圖不符！炸出網友集體曬“包裝照騙”，日本人破防：原來不止我被坑！

東京新青年

2026-02-24 17:46:14

收評：全股民做好準備！A股變盤點來了，不出意外明天將這樣走

收評：全股民做好準備！A股變盤點來了，不出意外明天將這樣走

財經大拿

2026-02-25 13:40:13

45歲薛凱琪春晚“水蛇腰”炸場，網友：方大同走了，她不會結婚了

45歲薛凱琪春晚“水蛇腰”炸場，網友：方大同走了，她不會結婚了

她時尚丫

2026-02-23 22:11:00

官宣！遼足名宿之子，18歲1米9前鋒，離開遼寧鐵人，加盟伯恩利

官宣！遼足名宿之子，18歲1米9前鋒，離開遼寧鐵人，加盟伯恩利

小金體壇大視野

2026-02-25 15:02:59

真正生理性的喜歡，根本藏不住！不是接吻和擁抱，而是……

真正生理性的喜歡，根本藏不住！不是接吻和擁抱，而是……

青蘋果sht

2026-02-22 06:58:00

中方投了棄權票

第一財經資訊

2026-02-25 11:22:55

痛心！海南一民警因公殉職，生命定格在50歲

痛心！海南一民警因公殉職，生命定格在50歲

蓬勃新聞

2026-02-25 14:37:52

女護士處理男患者隱私部位，會感覺難為情嗎？美女護士說出大實話

女護士處理男患者隱私部位，會感覺難為情嗎？美女護士說出大實話

第7情感

2025-09-17 12:12:15

2月24日俄烏最新：戰爭的天平開始傾斜

2月24日俄烏最新：戰爭的天平開始傾斜

西樓飲月

2026-02-24 21:37:50

澳大利亞驚現封閉亂倫家族：4代人近親繁衍38名成員全是亂倫產物

澳大利亞驚現封閉亂倫家族：4代人近親繁衍38名成員全是亂倫產物

第7情感

2026-02-23 20:45:16

中國男籃，郭士強任命新一任隊長

中國男籃，郭士強任命新一任隊長

體育哲人

2026-02-24 20:23:42

OpenClaw刪光Meta安全總監郵箱！連喊3次停手都沒用，她狂奔去拔網線

OpenClaw刪光Meta安全總監郵箱！連喊3次停手都沒用，她狂奔去拔網線

新智元

2026-02-24 12:33:20

“茶幾”正在退出中國家庭，學廣東人這樣做，實用性讓人大開眼界

“茶幾”正在退出中國家庭，學廣東人這樣做，實用性讓人大開眼界

室內設計師有料兒

2026-02-19 11:17:18

平頂山打人事件的二次通報，看完讓人后背發涼

平頂山打人事件的二次通報，看完讓人后背發涼

清書先生

2026-02-25 17:01:07

小米昆侖旗艦SUV全新預測圖曝光采用豎條式鍍鉻格柵

小米昆侖旗艦SUV全新預測圖曝光采用豎條式鍍鉻格柵

CNMO科技

2026-02-24 10:02:12

造不出就買！260 億吞下美國打印機巨頭，珠海破解暴利壟斷

造不出就買！260 億吞下美國打印機巨頭，珠海破解暴利壟斷

知識TNT

2026-02-24 12:30:09

AIGC大模型及應用精選與評測

437文章數 60關注度

往期回顧全部

科技要聞

“機器人只跳舞，沒什么用”

頭條要聞

女子被害留下3個女兒無人照顧辦案警察接力資助15年

頭條要聞

女子被害留下3個女兒無人照顧辦案警察接力資助15年

體育要聞

曝雄鹿計劃今夏追小卡字母哥渴望與其并肩作戰

娛樂要聞

撒貝寧到沈陽跑親戚老婆李白模特身材

財經要聞

GEO亂象：誰為AI營銷的泡沫買單？

汽車要聞

750km超長續航 2026款小鵬X9純電版將于3月2日上市

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

藝術

親子

本地

公開課

家居要聞

藝居辦公溫度與效率

本真棲居愛暖伴流年
中古雅韻樂韻伴日常
簡雅閑居靜享時光柔

藝術要聞

這位藝術家的馬賽克畫讓人驚嘆不已！

親子要聞

如何幫娃建立專注力持久性？

本地新聞

津南好·四時總相宜

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
古代的馬真能日行八百里嗎
李彥宏：百度離破產30天

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<tfoot id="k42t6"><samp id="k42t6"></samp></tfoot>