<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      能解奧數,不會看鐘:斯坦福2026年AI報告的15個判斷

      0
      分享至


      4月13日,斯坦福大學人本AI研究所(HAI)發(fā)布了2026年度AI Index報告。400多頁,覆蓋技術能力、投資格局、就業(yè)影響、公眾認知,是這個行業(yè)迄今最完整的第三方年度審計。

      這份報告從2017年開始連續(xù)發(fā)布,今年的結論可以用一句話概括:AI的能力正在以從未有過的速度跑贏一切——跑贏監(jiān)管框架,跑贏公眾信任,跑贏教育體系,甚至跑贏AI公司自己對信息透明度的意愿。

      以下是從報告中提煉的核心內容。

      原文鏈接:https://hai.stanford.edu/ai-index/2026-ai-index-report

      一、科學能解奧數,不會看鐘

      先從一個細節(jié)說起。

      今年的報告里有一張圖,橫軸是時間,縱軸是AI在各類任務上相對于人類的表現。圖上有一條線幾乎是垂直上升的:代碼能力。SWE-bench Verified——衡量AI自主完成真實軟件工程任務的標準測試——在一年之內從60%跳到了近100%。同期,AI代理處理現實任務的成功率從20%躍升至77.3%,網絡安全問題的解題率從15%飆到93%。


      過去一年,Terminal-Bench 2.0 的準確率顯著提升,從 2025 年 2 月的 20%提升到 2026 年初的 77.3%(見圖 2.5.2)。

      Humanity's Last Exam是一套由全球近千名領域專家共同設計的考題,專門為了難倒AI而生,覆蓋物理、數學、歷史、法律等幾乎所有高難度學科。2025年時,排名第一的模型只能答對8.8%的題目。到今天,前沿模型的得分已經超過50%。


      2024 年至 2025 年間,HLE 模型準確率提高了 30 個百分點(見圖 2.4.4)。一年內,準確率從不到 10%躍升到38.3%

      這不是線性增長,是躍遷。

      但同一份報告里,還有另一條線——機器人完成真實家務任務的成功率,折疊衣服、洗碗這類事,至今只有12%。AI仍然不能穩(wěn)定地看懂模擬時鐘。生成連貫視頻仍然困難,多步驟規(guī)劃仍然出錯,某些專家級學術考試仍然答不對。


      Gemini Deep Think 在 2025 年 IMO 中以自然語言進行首發(fā)工作,在 4.5 小時的時間限制內獲得 35 分(金),高于 2024 年獲得的 28 分銀獎。在 ClockBench 上,頂級型號能正確讀取模擬時鐘的 50.1%,而人類則為 90.1%

      能力的分布是不均勻的——某些維度已經超越了人類可以驗證的范圍,另一些地方仍在爬行。這是2026年AI的真實狀態(tài),也是接下來所有問題的底色。

      二、美國是中國投資額的23倍,但AI人才流入已跌了89%

      2025年,全球AI私人投資達到3447億美元,同比增長127.5%。企業(yè)層面的AI投資總額達到5817億美元,一年翻了一倍多。

      美國在這場軍備競賽里出手最猛。2025年,美國AI投資額2859億美元,是排名第二的中國(124億美元)的23倍。這個差距是壓倒性的。


      但同一份報告里,另一組數字指向了完全相反的方向。

      2017年到2026年,AI領域頂尖學者移居美國的數量下降了89%。僅在過去一年,這一數字又跌了80%。

      兩組數字放在一起的含義很清楚:美國在AI上砸的錢越來越多,但能用這些錢招到的最頂尖的人越來越少。錢還在涌入,但它的邊際價值正在被人才流失侵蝕。

      中國的投資邏輯與此不同。報告指出,單純以私人投資額比較,會系統性地低估中國投入AI的資本體量。中國政府通過"政府引導基金"這一機制,自2000年以來在包括AI在內的各領域累計部署了超過9120億美元。這筆錢不走市場化渠道,不出現在私人投資數據里,但它實實在在地存在。

      在模型數量上,美國2025年發(fā)布了50個"值得關注"的模型,中國大約30個,差距在縮小。在工業(yè)機器人安裝量上,中國2024年安裝了29.5萬臺,美國3.42萬臺,差距是8.6倍。中美在AI上走的是兩條平行賽道,正面交鋒的地方只是其中一部分。



      三、22歲的程序員已經感受到了,CEO還在說AI只是工具

      就業(yè)影響的數據今年第一次清晰到無法繞開。

      22到25歲的軟件開發(fā)者,從2024年以來就業(yè)人數下降了近20%。同一時期,26歲以上的同行就業(yè)人數基本持平甚至小幅增長。這不是整個軟件行業(yè)在萎縮——是AI沖擊從底部開始,精準地切掉了入門崗位。


      自 2022 年以來,最年輕工人(22 至 25 歲)的就業(yè)人數有所下降,盡管年長年齡段的員工人數持續(xù)增長(見圖 4.4.29)。到 2025 年 9 月,22 至 25 歲軟件開發(fā)者的就業(yè)人數較 2022 年峰值下降了近 20%。

      客服領域同樣出現了類似的模式:初級崗位在收縮,資深崗位暫時安全。

      三分之一的企業(yè)高管在麥肯錫的調查中表示,預計未來一年將進一步縮減員工規(guī)模,尤其集中在服務業(yè)、供應鏈和軟件工程。這是關于未來的計劃,不是已經發(fā)生的事。已經發(fā)生的是:年輕人先感受到了。

      報告的研究者同時提出了一個重要的限定:就業(yè)數據受到宏觀經濟的干擾,無法把AI的影響完全分離出來。但他們也指出了一個反常的現象——AI暴露程度低的職業(yè),失業(yè)率的上升反而高于AI暴露程度高的職業(yè)。這與"AI直接替代"的簡單敘事不符,背后可能有更復雜的勞動力市場重構正在發(fā)生。

      AI帶來的生產力提升數字,報告同樣給出了:客服領域提升14%,軟件開發(fā)領域提升26%。這些增益是真實的,但享受這些增益的,是已經在崗的、有經驗的工人。新進入市場的年輕人,面對的是崗位數量本身正在減少的入口。

      增益集中在上面,代價落在了底部。

      四、模型越來越強,告訴你它是怎么訓練出來的公司越來越少

      有一組數字在這份報告里是最少被引用的,但可能是最重要的。

      Foundation Model Transparency Index,衡量主要AI公司對其模型訓練數據、計算資源、能力邊界、風險及使用政策的披露程度。這個指標去年的平均分是58分,今年跌到了40分。

      報告的結論更直接:在透明度最低的模型里,往往是能力最強的那批。


      人工分析開放性指數根據權重的自由訪問和許可程度,以及訓練方法和訓練前后數據的透明度,對 AI 模型進行 0 到 100 的評分。領先模型的得分較低,大多數在 100 分中的 2 到 16 分之間(見圖 3.8.1)

      這是一個有意思的反轉。AI能力在加速進化,但公眾能用來理解、審查、監(jiān)督這些能力的信息,在系統性減少。大型模型的訓練數據是什么、用了多少算力、有哪些已知局限——這些本來應該隨著能力增強而更受關注的問題,正在隨著能力增強而變得更加不透明。

      公眾信任的數字也在印證這件事。全球調查中,只有31%的美國人表示信任本國政府能有效監(jiān)管AI,是所有被調查國家中倒數第二(中國是27%,墊底)。歐盟的數字是53%,差距明顯。

      與此同時,Gen Z對AI的情緒正在發(fā)生轉變。他們曾是生成式AI最早的熱情擁躉,現在的調查數據顯示這一人群的焦慮和憤怒在上升。TechCrunch引用的一位研究者說得更直白:AI領袖們自己都在說"如果什么都不做,很多人會很慘",然后奇怪為什么公眾會焦慮。

      4/5的美國高中和大學生在用AI完成學業(yè)任務,但只有6%的教師表示學校有清晰的AI使用政策。能力跑在前面,框架跑在后面,中間的空白地帶是每天在使用AI的幾億個普通人。



      五、訓練一個模型,等于1.7萬輛車跑一年

      AI的能力在加速,代價也在加速。只是這個代價大部分是看不見的。

      報告給出的數字:xAI的Grok 4,訓練產生的碳排放估計約為7.28萬噸CO?當量,相當于1.7萬輛汽車行駛一整年產生的溫室氣體。而Epoch AI的獨立估算認為這個數字更高,約為14萬噸。

      作為對比,OpenAI的GPT-4訓練排放約5184噸,Meta的Llama 3.1 405B約8930噸。從GPT-4到Grok 4,不到兩年,單次訓練的碳排放增加了超過10倍。

      推理側的消耗同樣在積累。全年GPT-4o的推理水耗(用于冷卻數據中心服務器或水力發(fā)電),據估算可能超過1200萬人全年的飲用水需求。全球AI數據中心的總電力容量達到29.6GW,相當于整個紐約州的峰值用電量,也與瑞士或奧地利的全國用電量相當。

      與能源消耗同步增長的,是算力的集中度。Nvidia的GPU目前占全球AI算力總量的60%以上,而全球AI算力自2022年以來每年增長3.3倍,累計已是2021年的30倍。整個AI系統的物理基礎,正在加速向少數幾家硬件供應商和超大規(guī)模云服務商集中。

      這些成本不會出現在AI產品的價格標簽上,也不會出現在生產力提升的統計數字里。但它們是真實的,只是被分攤到了大氣、地下水和電網里。

      報告里有一個細節(jié),可以作為整篇的注腳。

      AI已經能解開數學奧林匹克競賽的題目,但仍然不能穩(wěn)定地看懂模擬時鐘。

      這個不均勻性,不是AI的bug,是這個階段的特征。某些維度的能力已經超出了人類可以直覺驗證的范圍,另一些維度還在爬行。而我們正處在這兩條曲線都在快速移動的時刻——高速能力擴張,與治理、信任、透明度的同步滑落。

      斯坦福的研究者在報告序言里寫道:今年的報告揭示了"AI能做什么"與"我們準備好管理它沒有"之間的裂縫正在變寬。這份報告本身能做的,是用數據讓裂縫可見。

      裂縫之后怎么辦,是另一個問題。

      關注硅星GenAI,獲取最新AI資訊~

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      拿了錢還不放人!19歲花季少女被困柬埔寨56天,綁匪正臉照曝光!

      拿了錢還不放人!19歲花季少女被困柬埔寨56天,綁匪正臉照曝光!

      今朝牛馬
      2026-04-07 22:43:23
      中央氣象臺4月18日18時發(fā)布強對流天氣藍色預警

      中央氣象臺4月18日18時發(fā)布強對流天氣藍色預警

      環(huán)球網資訊
      2026-04-18 18:42:08
      塔利班最高領袖先下手為強,斬斷了國防部長的政治野心?

      塔利班最高領袖先下手為強,斬斷了國防部長的政治野心?

      阿傖說事
      2026-04-18 23:50:57
      廣東3壞消息!徐杰身體疑似出問題,比跌出前4更棘手的麻煩出現了

      廣東3壞消息!徐杰身體疑似出問題,比跌出前4更棘手的麻煩出現了

      后仰大風車
      2026-04-19 07:10:18
      不想訪華了?特朗普召回美駐華大使,貝森特放話:中國“不可靠”

      不想訪華了?特朗普召回美駐華大使,貝森特放話:中國“不可靠”

      通文知史
      2026-04-19 08:55:08
      云南省佛教協會副會長祜巴瑪哈香圓寂,享年59歲

      云南省佛教協會副會長祜巴瑪哈香圓寂,享年59歲

      澎湃新聞
      2026-04-17 10:34:30
      電腦一管硅脂用十年引熱議!網友直呼太離譜

      電腦一管硅脂用十年引熱議!網友直呼太離譜

      游民星空
      2026-04-17 19:40:21
      38歲梅西發(fā)威:無敵雙響炮,助邁阿密國際3-2+終結2輪不勝

      38歲梅西發(fā)威:無敵雙響炮,助邁阿密國際3-2+終結2輪不勝

      側身凌空斬
      2026-04-19 06:53:09
      張曼玉現身北京參加活動!臉僵腫到不敢認,網友:怪不得不上浪姐

      張曼玉現身北京參加活動!臉僵腫到不敢認,網友:怪不得不上浪姐

      阿廢冷眼觀察所
      2026-04-18 20:53:47
      越南一家企業(yè)遭全廠斷電,生產線停擺!只因供電方換了個名,“卡殼”被迫啟動發(fā)電機,開啟最低生存模式

      越南一家企業(yè)遭全廠斷電,生產線停擺!只因供電方換了個名,“卡殼”被迫啟動發(fā)電機,開啟最低生存模式

      越南語學習平臺
      2026-04-18 09:31:13
      票房破44億只是開始!于和偉、梁朝偉、周潤發(fā)要掀起一波新高潮了

      票房破44億只是開始!于和偉、梁朝偉、周潤發(fā)要掀起一波新高潮了

      八斗小先生
      2026-04-18 14:57:45
      “戲混子”沒走,比資本家丑孩子更可怕的是“星二代”開始世襲了

      “戲混子”沒走,比資本家丑孩子更可怕的是“星二代”開始世襲了

      流史歲月
      2026-01-26 10:58:30
      真不是故意穿得透!是優(yōu)勢太大,藏不住!

      真不是故意穿得透!是優(yōu)勢太大,藏不住!

      飛娛日記
      2026-04-11 12:20:19
      馬瀧醫(yī)療集團創(chuàng)始團隊合伙人徐勇病逝,終年56歲

      馬瀧醫(yī)療集團創(chuàng)始團隊合伙人徐勇病逝,終年56歲

      界面新聞
      2026-04-18 16:34:14
      如今隱居上海的黃梅瑩,和兒子徹底劃清界限后,75歲越活越瀟灑

      如今隱居上海的黃梅瑩,和兒子徹底劃清界限后,75歲越活越瀟灑

      青橘罐頭
      2026-04-15 14:54:15
      3段婚姻3個孩子3個爹,退役移居美國,52歲王軍霞現在過得怎么樣

      3段婚姻3個孩子3個爹,退役移居美國,52歲王軍霞現在過得怎么樣

      科學發(fā)掘
      2026-04-19 06:37:27
      日本剛降級中日關系,報應就來了?53條中日航線全部清零

      日本剛降級中日關系,報應就來了?53條中日航線全部清零

      兵說
      2026-04-18 08:39:21
      這是當年41歲的劉曉慶,簡直是人見人愛,花見花開,美若天仙

      這是當年41歲的劉曉慶,簡直是人見人愛,花見花開,美若天仙

      草莓解說體育
      2026-04-19 06:15:59
      拉唐6輪轟7球封神!申花天崩開局落后12分,金靴難救冠軍夢?

      拉唐6輪轟7球封神!申花天崩開局落后12分,金靴難救冠軍夢?

      羙晞
      2026-04-19 08:47:17
      同名同姓同身份證尾號,山東一女子稱被異地法院錯判,萬元存款被強制執(zhí)行,損失3年利息

      同名同姓同身份證尾號,山東一女子稱被異地法院錯判,萬元存款被強制執(zhí)行,損失3年利息

      封面新聞
      2026-04-18 16:24:02
      2026-04-19 09:43:00
      硅星GenAI incentive-icons
      硅星GenAI
      比一部分人更先進入GenAl。
      270文章數 36關注度
      往期回顧 全部

      科技要聞

      50分26秒!榮耀獲得人形機器人半馬冠軍

      頭條要聞

      牛彈琴:伊朗遭到特朗普"羞辱"被激怒 結果印度遭了殃

      頭條要聞

      牛彈琴:伊朗遭到特朗普"羞辱"被激怒 結果印度遭了殃

      體育要聞

      時隔25年重返英超!沒有人再嘲笑他了

      娛樂要聞

      劉德華回應潘宏彬去世,拒談喪禮細節(jié)

      財經要聞

      華誼兄弟,8年虧光85億

      汽車要聞

      奇瑞威麟R08 PRO正式上市 售價14.48萬元起

      態(tài)度原創(chuàng)

      藝術
      游戲
      教育
      家居
      軍事航空

      藝術要聞

      鄭麗文大陸之行引發(fā)熱議,孫中山贈對聯成焦點!

      《冰汽時代》系列慶典啟幕!官方致謝中國玩家

      教育要聞

      五年級壓軸題,不少人卻無從下手,尖子生直接心算

      家居要聞

      法式線條 時光靜淌

      軍事要聞

      解放軍護衛(wèi)艦與外艦纏斗20小時 細節(jié)披露

      無障礙瀏覽 進入關懷版