<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      AI 研究人員意外發現:我們以為的“學習規律”,原來全錯了

      0
      分享至


      【本文翻譯自nearlyright.com】

      還記得那條人人遵守的“機器學習鐵律”嗎?模型太大必然過擬合,只會死記硬背、學不到東西。這不是傳說,而是寫進教科書的定律——三個世紀以來的統計理論都這么說。

      直到有一天,這條“神圣不可侵犯”的規則被打破了。

      現在,擁有數千億甚至數萬億參數的神經網絡驅動著 ChatGPT,破解蛋白質結構,還引發了一場高達數千億美元的全球 AI 軍備競賽。而真正發生轉變的,不只是算力,而是我們對“學習本質”的重新理解。

      這個故事揭示了一項劃時代的 AI 突破,它的誕生源自一群敢于挑戰領域基礎假設的“異端”。

      300 年的偏差-方差法則,是怎么倒下的

      在很長一段時間里,偏差-方差權衡(bias-variance tradeoff)被視為學習理論的基石:模型太簡單,看不到重點;模型太復雜,記住的只是噪聲。

      想象一個小學生在學加法。他有兩個選擇:要么理解進位規則和位值原理,要么死記硬背所有題目和答案。后者在做作業時可能無懈可擊,但一到考試就全軍覆沒。

      傳統理論認為,神經網絡尤其容易“走歪路”。參數越多,越容易記住全部訓練數據而無法泛化。于是學術界的共識變成了:模型要小巧精致,結構要嚴控,正則化必須到位。誰要是提出“加點參數”來解決問題,簡直是學術異端。

      異端的反叛,撞出了“雙重下降”

      但就在 2019 年,一群研究者反其道而行之。他們不僅不在模型“剛好”學會時停下,反而繼續擴大規模,一路沖向“理論高危區”。

      結果呢?模型不僅沒崩塌,反而“第二次變強”。

      這一現象被稱為“double descent”(雙重下降):模型先是如理論所預言地過擬合,誤差上升,但接著神奇地誤差又開始下降,仿佛它穿越了過擬合的深淵,達到了新境界。提出者 Mikhail Belkin 等人坦言,這與經典偏差-方差理論“背道而馳”。

      OpenAI 后續的研究顯示,這種好處不止出現在一個模型里,而是普遍存在于不同任務和規模上。大模型不僅學得多,還開始具備“舉一反三”的能力——只看幾個例子就能學會一項新任務。

      從那一刻起,整個行業徹底掉頭:Google、Microsoft、Meta、OpenAI 紛紛豪擲數十億美元,一路堆參數。GPT 模型從 1.17 億擴張到 1750 億。“模型越大越好”從昔日的笑談,變成今天的行業信條。

      但問題來了:這一切,為什么行得通?

      “彩票假說”:為什么大模型反而學得更好

      謎底來自 MIT 的 Jonathan Frankle 和 Michael Carbin。他們研究的是“剪枝”技術——也就是在訓練之后刪掉那些沒用的權重。沒想到,他們發現了大模型的秘密。

      他們發現,每一個大模型中都藏著一個“中獎小模型”(winning ticket)——一小部分神經元構成的子網絡,性能可以媲美整個大模型。他們甚至能刪掉 96% 的參數而不損失精度。換句話說,大多數參數根本沒用。

      關鍵在于,這些“中獎票”只有在初始隨機權重保持不變時才有效。一旦你換了初始化方式,即便保留架構,也會一敗涂地。

      于是,“lottery ticket hypothesis”(彩票假說)誕生了:大模型不是靠復雜解取勝,而是靠參數數量帶來的機會空間。每一個子網絡就是一張彩票,大部分注定落空,但參數足夠多,總有一張是贏家。

      整個訓練過程,就是一場規模空前的彩票抽獎:模型里已有成千上萬個不同起點的小網絡,訓練過程挑出那張“天選之票”,其余統統淘汰。

      這個觀點讓傳統學習理論與實踐奇跡和解了:大模型之所以有效,不是因為它違反了規則,而是它在一個我們原本沒意識到的層次上“玩轉了規則”。奧卡姆剃刀依然成立——最簡單的解釋才是最優的。規模只是為了更高效地找到這些簡單解。

      重新定義“智能”

      如果“學習”就是在廣袤的可能空間中尋找最優雅的解釋,那“智能”本身也就可以被重新定義了。

      人腦有 860 億個神經元、萬億級連接,怎么看都是“過擬合怪獸”。但我們卻能憑幾個例子學會一個全新概念,并推而廣之。彩票假說指出,人腦的這種“冗余”正是為了讓你有更高的幾率抽中那個最簡潔的解法。

      智能,不是記住所有答案,而是發現規律的能力。大規模參數帶來的不是儲存空間,而是搜索空間。

      科學進步的本質:敢于懷疑“看似永恒”的法則

      這場關于神經網絡的發現,也提供了科學哲學上的啟發:我們很多時候不是在推翻原理,而是在揭示它們運行得比我們以為的更深、更復雜。

      想想大陸漂移,最初被視為荒唐,直到板塊構造解釋一切;量子力學看似不合常理,直到實驗證明一切真實存在。最深刻的進展,往往始于“敢于嘗試看起來不應該成功的事”。

      彩票假說也沒有推翻傳統學習理論,而是賦予它新的維度。偏差-方差權衡還在,只是我們現在知道,它是在更高維度上發生作用。

      這也意味著,當前的“大模型路線”是有效的,但也不是無限擴展的萬能鑰匙。越往后,抽中大獎的邊際收益越小。像 Yann LeCun 這樣的大牛也提醒我們,僅靠規模,語言模型也許永遠無法真正理解人類語言,因為它們缺乏根本性的架構突破。

      AI 革命的真相:原來最重要的不是算力,而是懷疑精神

      AI 的這次進化,不只是一次技術飛躍,更是一次思想解放。

      真正帶來改變的,是那群“明知不可為而為之”的研究者。他們挑戰了教科書、質疑了公理,最終發現:所謂的規則,其實并沒有錯,只是它們的運行方式遠比我們設想得更優雅、更復雜。

      在這個構建于數學確定性的學科里,最重要的突破,卻來自于對“未知”的勇敢擁抱。

      【注:】

      盡管“偏差-方差權衡”這一術語直到 20 世紀后半葉才逐漸標準化,但它背后的數學思想,早在18 世紀就已萌芽。1763 年,Bayes 定理為后來的統計推理奠定了基礎,使我們能夠用數據來更新信念;而Laplace在 1780 年代至 1810 年代之間的研究,則首次明確提出:模型若過于復雜,容易捕捉噪聲而非信號——必須在擬合度與簡潔性之間保持平衡。

      這一思想,正是現代“偏差-方差權衡”原則的雛形。從那個時代開始,統計學就逐漸形成了這樣一種哲學:最好的模型不是記住所有細節,而是用最簡潔的方式解釋世界

      也就是說,當 AI 研究人員在 2019 年挑戰“模型越大越糟”的共識時,他們不是在反對幾百年來的統計智慧,而是在揭示這些原則在更復雜系統中依舊成立,只是以更微妙的方式運行

      本文由「AI 范兒」出品

      我每天都在更新,如果你覺得這些內容對你有用,

      那我們就加個關注、交個朋友。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      英國首富、戴森公司創始人將6.24億英鎊轉至新加坡,其英國實體股本被削減至1英鎊

      英國首富、戴森公司創始人將6.24億英鎊轉至新加坡,其英國實體股本被削減至1英鎊

      紅星新聞
      2025-12-24 21:58:21
      突發!確診血栓+無限期缺陣,NBA生涯懸了,他才21歲啊,可惜了

      突發!確診血栓+無限期缺陣,NBA生涯懸了,他才21歲啊,可惜了

      球童無忌
      2025-12-24 13:20:13
      比恒大還慘!中國第二大民企轟然倒塌,負債7500億,創始人被帶走

      比恒大還慘!中國第二大民企轟然倒塌,負債7500億,創始人被帶走

      甜檸聊史
      2025-12-24 18:22:43
      “荒唐”的事一直在發生,真是太諷刺了!

      “荒唐”的事一直在發生,真是太諷刺了!

      高三倒計時
      2025-12-24 15:21:26
      吃他汀,不吃柚子,能吃桔子、橙子和檸檬嗎?醫生解答

      吃他汀,不吃柚子,能吃桔子、橙子和檸檬嗎?醫生解答

      健康之光
      2025-12-24 09:12:42
      新加坡前外長:若中美開戰,美國取勝必用核武,但中國有反制絕招

      新加坡前外長:若中美開戰,美國取勝必用核武,但中國有反制絕招

      瞻史
      2025-12-23 15:56:44
      關系藏不住了!樊振東放著世界冠軍陳夢不選,原來他喜歡這樣的

      關系藏不住了!樊振東放著世界冠軍陳夢不選,原來他喜歡這樣的

      誮惜顏a
      2025-12-24 05:53:10
      39歲美國甜心毀容照曝光,揭開了好萊塢最惡心的一面

      39歲美國甜心毀容照曝光,揭開了好萊塢最惡心的一面

      陳天宇
      2025-12-23 11:52:51
      “消失”的王小海,揭穿玖月奇跡的尷尬處境,印證了鳳凰傳奇的話

      “消失”的王小海,揭穿玖月奇跡的尷尬處境,印證了鳳凰傳奇的話

      豐譚筆錄
      2025-12-24 00:06:58
      文班主動放棄101場蓋帽紀錄!最后4分鐘不打了,拒絕學詹皇刷數據

      文班主動放棄101場蓋帽紀錄!最后4分鐘不打了,拒絕學詹皇刷數據

      嘴炮體壇
      2025-12-24 21:04:53
      陳赫前妻許婧和匈牙利老公在沙特慶生,39 歲身材超棒,太吸睛。

      陳赫前妻許婧和匈牙利老公在沙特慶生,39 歲身材超棒,太吸睛。

      鄉野小珥
      2025-12-23 05:38:57
      美國再施壓!安理會緊急會議 中方連說5個“反對”

      美國再施壓!安理會緊急會議 中方連說5個“反對”

      看看新聞Knews
      2025-12-24 10:42:04
      合肥衛健委通報“一新生兒住院治療黃疸時死亡”:相關涉事人員已停職接受調查

      合肥衛健委通報“一新生兒住院治療黃疸時死亡”:相關涉事人員已停職接受調查

      界面新聞
      2025-12-24 10:58:04
      慘烈!飛機墜海 多人遇難! 海水猛灌機艙殘骸 乘客深海絕望

      慘烈!飛機墜海 多人遇難! 海水猛灌機艙殘骸 乘客深海絕望

      北國向錫安
      2025-12-24 10:28:47
      盧卡-齊達內:父親支持我的選擇,加入阿爾及利亞讓祖父驕傲

      盧卡-齊達內:父親支持我的選擇,加入阿爾及利亞讓祖父驕傲

      懂球帝
      2025-12-24 21:32:25
      徹底摧毀雷霆74勝之夢?馬刺20分再勝雷霆 真克星!

      徹底摧毀雷霆74勝之夢?馬刺20分再勝雷霆 真克星!

      體壇周報
      2025-12-24 12:26:24
      龐萊臣曾孫女龐叔令的聲明:新華社未采訪本人,質疑南博鑒定材料公開不公

      龐萊臣曾孫女龐叔令的聲明:新華社未采訪本人,質疑南博鑒定材料公開不公

      新浪財經
      2025-12-24 13:24:56
      江蘇一百歲老人,時隔60多年才突然發現,自己是中央特科重要人員

      江蘇一百歲老人,時隔60多年才突然發現,自己是中央特科重要人員

      鶴羽說個事
      2025-12-24 15:09:23
      越南少將阮德輝吐實情:中國軍隊回撤途中黎筍下了道死命令

      越南少將阮德輝吐實情:中國軍隊回撤途中黎筍下了道死命令

      磊子講史
      2025-12-23 20:13:04
      中國麻將,最初是如何讓美國男女老少癡迷的?

      中國麻將,最初是如何讓美國男女老少癡迷的?

      新京報
      2025-12-23 22:04:35
      2025-12-24 23:23:00
      AI范兒 incentive-icons
      AI范兒
      AI范兒是一個專注于人工智能領域的資訊和學習平臺,提供最新的人工智能資訊
      622文章數 337關注度
      往期回顧 全部

      科技要聞

      智譜和MiniMax拿出了“血淋淋”的賬本

      頭條要聞

      61歲女"老虎"王峻被查 一直在西藏自治區工作

      頭條要聞

      61歲女"老虎"王峻被查 一直在西藏自治區工作

      體育要聞

      26歲廣西球王,在質疑聲中成為本土得分王

      娛樂要聞

      懷孕增重30斤!闞清子驚傳誕一女夭折?

      財經要聞

      北京進一步放松限購 滬深是否會跟進?

      汽車要聞

      “運動版庫里南”一月份亮相???或命名極氪9S

      態度原創

      時尚
      教育
      健康
      公開課
      軍事航空

      對不起周柯宇,是陳靖可先來的

      教育要聞

      183cm初中生為了10塊錢撒嬌,家長無奈吐槽:已經激發不出母愛了

      這些新療法,讓化療不再那么痛苦

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      "九三"受閱女民兵:96米需踢出128個正步 每步75厘米

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 永春县| 老熟妇一区二区三区啪啪| 欧美音影成人在线一级片| 亚洲韩欧美第25集完整版| 色欲av伊人久久大香线蕉影院| 无码中文字幕人妻在线一区| 亚洲v欧美| 中文字幕亚洲天堂| 一本久道中文无码字幕av| chinese极品人妻videos| 四虎永久在线精品无码| 普宁市| 人妻内射视频麻豆| 欧美疯狂做受xxxx高潮小说| 欧州成人与兽| 亚洲无码天堂| 久久国产乱子伦免费精品| 人妻另类 专区 欧美 制服| 亚洲精品久久麻豆蜜桃| 色婷婷婷婷| 精品乱码一区二区三四区视频| 永久黄网站色视频免费| 日韩码无第15页| 国产裸舞一区二区| 精品国产乱码久久久久久婷婷| 亚洲av无码专区在线亚| 天天艹天天干| 亚色天堂| 激情97综合亚洲色婷婷五| 九九热精品免费视频| 91免费网站在线观看| 99精品国产丝袜在线拍国语 | 成人国产精品秘片多多| 国产一区二区午夜福利久久| 岛国无码在线观看| 亚洲乱码av中文一区二区| 国产欧美日韩亚洲一区二区三区 | 免费A片国产毛无码A片| 日日躁天天躁AAAAXxXX痛| 国产成人综合久久久久久| 成年女人免费毛片视频永久|