<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      斯坦福2026AI指數報告發布:5張圖看懂AI正在發生什么

      0
      分享至


      (來源:麻省理工科技評論)

      如果你在關注 AI 新聞,你大概率已經看得眼花繚亂了——AI 堪比淘金熱;AI 只是經濟泡沫;AI 在搶走你的工作;AI 連個鐘表都看不懂……

      近期,在這些聲音中,斯坦福大學以人為本人工智能研究所(HAI)撰寫的“AI 年度成績單” 新鮮出爐,以幫我們在噪音之中撥云見霧。

      盡管有預測說 AI 發展已經觸及到了天花板,這份報告顯示頂尖模型仍在持續變強。人們擁抱 AI 的速度,比當年接受個人電腦和互聯網時都要快。AI 公司創造收入的速度超過了以往任何一輪技術浪潮中的公司,與此同時它們也在數據中心和芯片上砸下數千億美元。而用來衡量 AI 的基準測試、用來約束 AI 的政策,以及整個就業市場,都在艱難地追趕 AI 的步伐。AI 在狂奔,而剩下的人還在找鞋穿。

      這種速度是有代價的。全球 AI 數據中心的耗電量如今可達 29.6 吉瓦,足以在用電高峰時支撐整個紐約州的運轉。僅 OpenAI 的 GPT-4o 每年的耗水量,就可能超過 1200 萬人的飲用水需求。這些數據揭示了一項演進速度超過我們管理能力的技術。下面我們來看看這份報告里幾個關鍵點。



      中美水準并駕齊驅

      Arena 是一個由用戶驅動的 AI 模型排行榜,它讓用戶把相同的提示詞同時丟給不同的大語言模型,再根據大量用戶的投票結果給模型排名。根據 Arena 的最新數據,美國和中國在 AI 模型性能上幾乎并駕齊驅。2023 年初,OpenAI 憑借 ChatGPT 遙遙領先,但隨著 Google 和 Anthropic 相繼推出自己的模型,這一差距在 2024 年逐漸縮小。2025 年 2 月,中國的 DeepSeek 推出的 R1 一度追平了當時美國最頂尖的模型 ChatGPT。截至 2026 年 3 月,Anthropic 位居榜首,緊隨其后的是 xAI、Google 和 OpenAI。DeepSeek 和阿里巴巴等中國模型也不遑多讓。如今頂尖 AI 模型之間的差距已經被壓縮到發絲之細,它們正在轉而比拼成本、可靠性和實際可用性。


      (來源:麻省理工科技評論)

      報告指出,美國和中國的 AI 優勢各有不同。美國擁有更強的 AI 模型、更多的資本,以及估計約 5427 個數據中心,是任何其他國家的 10 倍以上;中國則在 AI 研究論文、專利和機器人領域領先。

      隨著競爭加劇,OpenAI、Anthropic 和 Google 等公司已經不再公開模型的訓練代碼、參數數量和數據集規模。“關于如何預測模型的行為,我們有很多東西還不清楚,”南加州大學計算機科學家、該報告的合著者約蘭達·吉爾(Yolanda Gil)說。她表示,這種不透明讓獨立研究人員很難研究如何讓 AI 模型變得更安全。



      模型能力進步飛快

      盡管有聲音預測發展會進入平臺期,AI 模型卻一直在變得越來越強。按某些衡量標準,它們在旨在測試博士級科學、數學和語言理解能力的考試上已經達到或超過了人類專家的水平。針對 AI 模型的軟件工程基準測試 SWE-bench Verified,頂尖成績從 2024 年的約 60% 躍升到 2025 年的近 100%。2025 年,一個 AI 系統獨立完成了天氣預報。

      “這項技術持續在進步,完全沒有進入平臺期,我被震驚到了?!奔獱栒f。


      (來源:麻省理工科技評論)

      不過 AI 在其他很多領域仍然吃癟。由于模型是通過處理海量文本和圖像來學習,而不是通過親歷物理世界,它們表現出一種“參差不齊的智能”:機器人仍處于起步階段,只能完成 12% 的家務任務;自動駕駛汽車發展稍快,Waymo 已經在美國五個城市運行,百度的 Apollo Go 也在中國各地接送乘客。AI 也在向法律、金融等專業領域擴展,但目前還沒有哪個模型能主導這些領域



      基準測試已經落后

      這些進步數據需要保留余地。斯坦福報告指出,用來追蹤 AI 進展的基準測試正被模型飛速突破,已經跟不上節奏。有的基準本身就做得不夠嚴謹——一個流行的數學能力基準測試的錯誤率高達 42%。有的則容易被“作弊”:比如當模型直接在基準測試的數據上接受了訓練,它可以學會拿高分而并沒有真的變聰明。

      由于 AI 實際使用的方式與它被測試的方式很少一致,基準測試的好成績并不總能轉化為真實世界的表現。而對于 AI 智能體和機器人這類復雜的交互式技術,相應的基準測試幾乎還不存在。

      AI 公司也越來越少公開自己的模型是如何訓練的,獨立測試得出的結論有時與公司自己報告的不一致?!昂芏喙静还_自己的模型在某些基準上的表現,尤其是那些涉及‘負責任 AI’的基準,”吉爾說,“你不公開某項基準的表現,這件事本身可能就說明了一些問題。”



      AI 開始影響就業

      進入主流視野不到三年,AI 的用戶已經覆蓋了全球超過一半的人口,普及速度超過了個人電腦和互聯網。估計有 88% 的機構組織在使用 AI,大學生里每五人有四人用過 AI。

      部署還處于早期,AI 對就業的影響很難量化。不過一些研究顯示,AI 已經開始影響特定行業的年輕從業者。斯坦福經濟學家 2025 年的一項研究顯示,22 到 25 歲軟件開發者的就業人數自 2022 年以來下降了近 20%。這一下降未必能全部歸因于 AI,更廣泛的宏觀經濟環境也可能是原因,但 AI 看起來確實在其中扮演了角色


      (來源:麻省理工科技評論)

      雇主們表示招聘可能會繼續收緊。麥肯錫 2025 年的一項調查顯示,三分之一的組織預計 AI 將在未來一年內縮減他們的員工規模,尤其是服務與供應鏈運營和軟件工程領域。報告引用的研究數據顯示,AI 在客戶服務領域提升了 14% 的生產力,在軟件開發領域提升了 26%,但對那些更依賴判斷力的任務,生產力收益并未顯現。整體上看,AI 對經濟的更大影響還需要更多時間才能看清楚。



      公眾專家判斷相左

      全球范圍來看,人們對 AI 既樂觀又焦慮:報告引用的益普索(Ipsos)調查顯示,59% 的人認為 AI 帶來的好處會多于壞處,52% 的人則說 AI 讓他們緊張。

      值得注意的是,專家和普通公眾對 AI 未來的判斷差異懸殊,最大的鴻溝出現在對就業的預期上:73% 的專家認為 AI 將對人們的工作方式產生正面影響,但美國公眾里持此觀點的只有 23%。在 AI 對教育和醫療的影響上,專家同樣比公眾更樂觀,但雙方都認同 AI 將損害選舉和人際關系。


      (來源:麻省理工科技評論)

      在受訪國家中,美國人對本國政府監管 AI 的信心最低——這是益普索另一項調查的結論。擔心聯邦 AI 監管力度不夠的美國人,多于擔心監管過度的人。



      各國政府艱難立法

      各國政府都在掙扎著為 AI 立規矩,過去一年里確實有一些進展。歐盟《人工智能法案》的首批禁令已生效,禁止在預測性警務和情感識別中使用 AI。日本、韓國和意大利也通過了各自的國家級 AI 法律。美國聯邦政府則走向了去監管化,特朗普總統簽署行政命令,試圖限制各州對 AI 的監管權。

      盡管聯邦層面是這樣的動作,美國各州立法機構仍然通過了創紀錄的 150 項 AI 相關法案。加州通過了具有標志性意義的立法,包括 SB 53 法案,要求 AI 模型開發者履行安全披露義務,并為舉報者提供保護。紐約通過了 RAISE 法案,要求 AI 公司公開安全規范并報告重大安全事件。


      (來源:麻省理工科技評論)

      但吉爾說,盡管立法活動頻繁,監管仍然跑在技術后面,因為我們對 AI 本身的理解還不夠?!案鲊诒O管 AI 上很謹慎,因為……我們很多事情都沒搞清楚,”她說,“我們對這些系統還沒有很好的把握。”

      https://www.technologyreview.com/2026/04/13/1135675/want-to-understand-the-current-state-of-ai-check-out-these-charts/

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      懸賞萬元,  江蘇一植物園卡皮巴拉出逃, 1歲多已經四五十斤

      懸賞萬元, 江蘇一植物園卡皮巴拉出逃, 1歲多已經四五十斤

      萬象硬核本尊
      2026-04-16 20:58:22
      愛潑斯坦文件曝光!證人實錘了:愛潑斯坦把梅拉尼婭介紹給特朗普

      愛潑斯坦文件曝光!證人實錘了:愛潑斯坦把梅拉尼婭介紹給特朗普

      吃貨的分享
      2026-04-16 17:13:11
      曾經風靡一時、火遍全國的稱重快餐,終于被自己的套路玩死了!

      曾經風靡一時、火遍全國的稱重快餐,終于被自己的套路玩死了!

      今朝牛馬
      2026-04-16 15:20:11
      上海32歲女子離婚2年求復婚,兒子一句傳話讓她瞬間崩潰痛哭

      上海32歲女子離婚2年求復婚,兒子一句傳話讓她瞬間崩潰痛哭

      搗蛋窩
      2026-04-16 15:54:37
      婆婆罵我破鞋,我微笑,我轉頭問公公:你肯定你兒子流的是你的血嗎

      婆婆罵我破鞋,我微笑,我轉頭問公公:你肯定你兒子流的是你的血嗎

      大熊歡樂坊
      2026-04-17 09:34:45
      絲芭創始人王子杰逝世之后,偶像產業駛向何方?

      絲芭創始人王子杰逝世之后,偶像產業駛向何方?

      界面新聞
      2026-04-17 08:01:18
      鴻蒙五界3月銷量啞火,問界獨大,四界陪跑,華為難救二線車企?

      鴻蒙五界3月銷量啞火,問界獨大,四界陪跑,華為難救二線車企?

      王新喜
      2026-04-14 19:49:11
      她長得太漂亮從護士轉行做演員,離婚11年未再嫁,如今46歲風韻猶存

      她長得太漂亮從護士轉行做演員,離婚11年未再嫁,如今46歲風韻猶存

      LULU生活家
      2026-04-16 18:46:56
      淪為共享單車的女色虎

      淪為共享單車的女色虎

      深度報
      2026-03-05 22:39:27
      71歲沈富麟現狀:退休不到1年,體型暴瘦,從上海到江蘇桃李滿園

      71歲沈富麟現狀:退休不到1年,體型暴瘦,從上海到江蘇桃李滿園

      白面書誏
      2026-04-16 14:50:20
      手握20多個冠軍,嫁外國名將帶夫定居廣州,如今是中山大學副教授

      手握20多個冠軍,嫁外國名將帶夫定居廣州,如今是中山大學副教授

      以茶帶書
      2026-04-16 14:50:51
      雷軍:未來幾年,小米都不會做10萬元以內車型

      雷軍:未來幾年,小米都不會做10萬元以內車型

      IT之家
      2026-04-17 08:30:15
      世上渣女千千萬,最怕王曉晨這種,這次俞灝明算是遇到高端玩家了

      世上渣女千千萬,最怕王曉晨這種,這次俞灝明算是遇到高端玩家了

      卷史
      2026-04-17 00:52:56
      市委決定:賀泳江任豐臺區委常委

      市委決定:賀泳江任豐臺區委常委

      新豐臺
      2026-04-16 22:10:43
      臉沒恢復就別出來拍劇了,頂著膨脹臉、說話嘴歪全是痘坑,太出戲

      臉沒恢復就別出來拍劇了,頂著膨脹臉、說話嘴歪全是痘坑,太出戲

      翰飛觀事
      2026-04-16 17:03:30
      昔日割據稱王,今日跪求祖國!真主黨窮途末路,是自己埋下的死局

      昔日割據稱王,今日跪求祖國!真主黨窮途末路,是自己埋下的死局

      民間胡扯老哥
      2026-04-16 07:13:02
      14+3!軟了一個賽季卻在關鍵戰硬了!巴特勒6000萬年薪該分你一半

      14+3!軟了一個賽季卻在關鍵戰硬了!巴特勒6000萬年薪該分你一半

      鳴哥說體育
      2026-04-17 09:53:57
      腦梗最怕的三種維生素,不妨了解!

      腦梗最怕的三種維生素,不妨了解!

      藥師方健
      2026-04-10 22:05:32
      晚年李銀橋臨終吐真言:毛主席對粟裕的最高評價,終于瞞不住了!

      晚年李銀橋臨終吐真言:毛主席對粟裕的最高評價,終于瞞不住了!

      山月明史
      2026-04-16 20:05:53
      沉默2天后,中方通告全球,藏南是中國領土,并送給印度一個忠告

      沉默2天后,中方通告全球,藏南是中國領土,并送給印度一個忠告

      有牙的兔紙
      2026-04-16 14:12:43
      2026-04-17 10:44:49
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      16586文章數 514886關注度
      往期回顧 全部

      科技要聞

      Anthropic推出Opus 4.7,坦言依不及Mythos

      頭條要聞

      男子快遞被人力資源女同事私自拆開 幾天后反被開除

      頭條要聞

      男子快遞被人力資源女同事私自拆開 幾天后反被開除

      體育要聞

      皇馬拜仁踢出名局,但最搶鏡的還是他

      娛樂要聞

      絲芭傳媒創始人王子杰去世,享年63歲

      財經要聞

      海爾與醫美女王互撕 換血抗衰誰的生意?

      汽車要聞

      埃安N60預售11.58萬起 標配激光雷達/零重力座椅

      態度原創

      游戲
      數碼
      教育
      時尚
      軍事航空

      《漫威爭鋒》黑貓性感翹臀引爭議:玩家指控色情成癮

      數碼要聞

      Alienware聯合Team Liquid推出《星球大戰》主題鍵帽、鼠標墊

      教育要聞

      從“陪練”到“引路”:我們是如何陪孩子跳出冠軍與學霸雙軌的——王亮家教好故事

      爆火的前額葉梗,讓多少年輕人主動確診「腦殘」?

      軍事要聞

      美宣布黎以停火10天 以方稱不會撤軍

      無障礙瀏覽 進入關懷版