<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      他們在1993年就提出了Scaling Law

      0
      分享至

      明敏 發自 凹非寺
      量子位 | 公眾號 QbitAI

      原來,Scaling Law在32年前就被提出了!

      不是2020年的OpenAI、不是2017年的百度,而是1993年的貝爾實驗室。



      在一篇名為《Learning Curves: Asymptotic Values and Rate of Convergence》的文章里提出一種預測方法:

      訓練誤差和測試誤差隨訓練規模增加,都會收斂到同一個漸近誤差值,這種收斂符合冪律形式。

      通過這種方法,研究人員可以預測模型在更大數據集上的表現。



      這和現在大家常提的Scaling Law幾乎一致:

      在合理的范圍內,通過簡單地增加模型參數量(N)、訓練數據量(D)和計算量(FLOPS,C),可以以一種可預測的、平滑的方式顯著提升模型性能。

      而1993年的這篇論文來頭也不小,作者一共5位,其中包含了支持向量機的提出者Vladimir Vapnik和Corinna Cortes。



      為省算力提出預測曲線

      這篇論文的研究初衷是為了節省訓練分類器(classifiers)的計算資源(果然啥時候都缺算力)。

      當時的機器學習算法能實現將輸入數據分配到某個類別里,比如輸入一張手寫數字的像素點,判斷它是不是某一個數組。

      為了讓分類器更可靠,往往需要使用大規模數據庫訓練。但是研究人員并不確定分類器是否適合給定任務,因此開發高效的預測程序非常有必要。

      這項研究就是提出了一種預測方法,先在中等規模的數據集上訓練,然后通過提出的學習曲線建模外推,預測其在大數據集上的表現。這樣就不用對分類器進行完整訓練,從而節省計算資源。

      它首先在幾個中等規模訓練集上分別計算測試誤差、訓練誤差,然后他們發現,隨著訓練集的規模變大,訓練誤差和測試誤差都會收斂到一個相同的漸近值a,這個指數a在0.5-1之間。



      • a:漸近誤差(最終無法消除的誤差,比如任務不可實現性導致的殘余錯誤)。
      • b,c:幅度參數。
      • α:收斂速率指數(通常在 0.5~1 之間)

      然后變換為對數線性關系,在對數坐標下得到兩條直線。



      通過擬合這兩條直線能得到a,b,α。

      將估計出的冪律曲線外推到更大的訓練集規模上(比如60000),預測分類器在完整數據上的誤差。

      實驗結果表明,在線性分類器(布爾分類任務)中預測非常準確。



      在多層神經網絡(如LeNet)中,即便在任務不可實現(non-realizable)的情況下,外推結果也能很好地預測大規模訓練的最終表現。

      比如僅用12000樣本訓練,就能預測新CNN在60000樣本上會優于舊CNN。



      此外作者還發現,任務越困難,漸近誤差越高,收斂速率越小,即學習越慢。



      這個理論放在當時可以用來淘汰差的模型,將有限的計算資源放在更值得訓練的模型上。

      作者也是支持向量機提出者

      最后不得不提一下這篇研究的幾位作者。

      首先來看Vladimir Vapnik,他因在統計學習理論和支持向量機方面的貢獻而聞名。



      他于1958年在烏茲別克國立大學獲得數學碩士學位,并于1964年在莫斯科控制科學研究所獲得統計學博士學位。1961年至1990年期間,他一直在該研究所工作,并擔任計算機科學研究部門的負責人。

      Vapnik與Alexey Chervonenkis在1960年至1990年間共同開發了Vapnik-Chervonenkis理論(也稱為VC理論)。該理論是計算學習理論的一種形式,旨在從統計學角度解釋學習過程。

      它是統計學習理論的基石,為學習算法的泛化條件提供了理論基礎,并量化了模型的復雜性(通過VC維)。VC理論在無需定義任何先驗分布的情況下,為機器學習提供了一種更通用的方法,與貝葉斯理論形成了對比。

      同時Vapnik也是支持向量機(SVM)的主要發明者。這是一種監督學習模型,用于數據分類和回歸分析。1964年,Vapnik和Chervonenkis首次提出了原始的SVM算法。

      1990年代,Vapnik加入貝爾實驗室開始進行機器學習方面的深入研究。在1992年他和Bernhard Boser、Isabelle Guyon提出了通過應用“核技巧”(kernel trick)來創建非線性分類器的方法,極大地擴展了SVM的應用范圍,使其能夠處理非線性可分問題。

      1995年Vapnik和Corinna Cortes提出了軟邊距的非線性SVM并將其應用于手寫字符識別問題,因為性能表現出色,這篇論文引發廣泛關注,也成為機器學習發展中的一塊重要基石。



      他撰寫的《統計學理論的本質》也是機器學習領域的必讀著作之一。

      以及他2014年還給Facebook當過顧問。



      另一位重要作者是Corinna Cortes。她現在是Google Research紐約分部的副總裁,負責廣泛的理論和應用大規模機器學習問題研究。

      她于1989年在哥本哈根大學尼爾斯·玻爾研究所獲得物理學碩士學位。隨后,她于1993年在羅切斯特大學獲得計算機科學博士學位。

      在加入Google之前,Cortes在貝爾實驗室工作了十多年。

      2022年她被任命為ACM Fellow,以表彰她對機器學習領域的貢獻。



      其余幾位作者分別是:L. D. Jackel、Sara A. Solla和John S. Denker

      其中John S. Denker還和LeCun在手寫識別上合作過多篇論文,也都是機器學習經典大作了。





      而他本人也相當全能,涉獵領域包括機器學習、系統安全、好萊塢特效、電子游戲和視頻游戲等,完成了很多開創性工作。還曾在加州理工學院創建并教授“微處理器設計”課程(硅谷之所以成為硅谷,和當時美國高校中開始推行芯片設計課程有很大關系)。

      甚至,他還是一個飛行員,是FFA的航空安全顧問,并寫了一本對飛行原理解釋透徹的行業教科書。

      Denker還曾于1986-87年擔任加州大學圣巴巴拉分校理論物理研究所的訪問教授。 他以幽默感和“原型瘋狂科學家”的形象而聞名,他的一些事跡甚至在一些電影中有所體現。



      One More Thing

      值得一提的是,卷積神經網絡和支持向量機都誕生于貝爾實驗室。它們之間過一段“分庭抗禮”的時期。

      在深度學習興起之前,CNN因為“黑盒”以及需要大規模訓練,一些研究者對其持有保留態度;相比之下支持向量機的理論清晰、易于收斂到全局最優解。到底誰是正確路線?一時爭論不休。

      1995年,Vapnik還和當時的上司Larry Jackel以一頓豪華晚餐打賭,到2000年時,人們能不能解釋清楚大型神經網絡為什么在大規模訓練中表現很好?

      Vapnik覺得不能。2000年他贏了;隨后他們又賭,再過5年結果如何?這一次Vapnik錯了:

      在2005年任何頭腦清醒的人都不會再用和1995年時完全相同的模型了。

      這場賭局,LeCun是見證人。



      論文地址:
      https://proceedings.neurips.cc/paper/1993/file/1aa48fc4880bb0c9b8a3bf979d3b917e-Paper.pdf


      [1]https://x.com/gdb/status/1962594235263427045
      [2]https://yorko.github.io/2022/vapnik-jackel-bet/

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      張康陽低調富二代,10億收購國米背后的真實動機與考驗

      張康陽低調富二代,10億收購國米背后的真實動機與考驗

      生活新鮮市
      2026-02-22 04:40:59
      中國游客貝加爾湖遇難最新消息:7人身份全部確認,均未通過正規旅行社報名;事故后當地又發生多起陷車事故

      中國游客貝加爾湖遇難最新消息:7人身份全部確認,均未通過正規旅行社報名;事故后當地又發生多起陷車事故

      大風新聞
      2026-02-21 23:13:45
      人不會無故得陰道癌!醫生直言:有陰道癌的女性,多半有3個習慣

      人不會無故得陰道癌!醫生直言:有陰道癌的女性,多半有3個習慣

      健康之光
      2026-02-11 14:14:41
      1次發聲破局!沉默反擊藏真相,全紅嬋離隊迷霧終解開

      1次發聲破局!沉默反擊藏真相,全紅嬋離隊迷霧終解開

      卿子書
      2026-02-21 08:46:34
      為什么現在鮑魚這么便宜?網友:最大的優勢是久燉不老

      為什么現在鮑魚這么便宜?網友:最大的優勢是久燉不老

      夜深愛雜談
      2026-02-21 22:00:16
      戰場變泥潭,俄烏兩軍同時迎來苦難期,杜金建議綁架烏克蘭高層

      戰場變泥潭,俄烏兩軍同時迎來苦難期,杜金建議綁架烏克蘭高層

      史政先鋒
      2026-02-20 21:15:35
      過年回家,我發現,高學歷回家的人,和那些早早出門打拼的人,有一個巨大的差別!

      過年回家,我發現,高學歷回家的人,和那些早早出門打拼的人,有一個巨大的差別!

      藝鑒在線
      2026-02-21 07:44:58
      特朗普暗示違法征收的關稅不退了

      特朗普暗示違法征收的關稅不退了

      財聯社
      2026-02-21 06:46:21
      哭窮炫富當三姐,裝了10年原形畢露,吉克雋逸辜負劉歡的期望

      哭窮炫富當三姐,裝了10年原形畢露,吉克雋逸辜負劉歡的期望

      郭蛹包工頭
      2026-02-22 05:45:24
      湖南益陽一女子輸液4秒藥物過敏不治身亡!藥物過敏該如何應對?

      湖南益陽一女子輸液4秒藥物過敏不治身亡!藥物過敏該如何應對?

      王曉愛體彩
      2026-02-21 22:45:17
      易夢玲一雙金燦燦的大燈,明艷晃眼

      易夢玲一雙金燦燦的大燈,明艷晃眼

      吃瓜黨二號頭目
      2026-02-13 08:13:30
      70歲后想多活30年,記住這5句話,活好余生每一日

      70歲后想多活30年,記住這5句話,活好余生每一日

      青蘋果sht
      2026-01-31 05:27:33
      終于知道家長要怎么面對孩子學業無成了,網友說得真實,不得不服

      終于知道家長要怎么面對孩子學業無成了,網友說得真實,不得不服

      夜深愛雜談
      2026-02-21 22:55:00
      全網為江蘇點贊!江蘇春晚賈旭明的諷刺小品爆火!

      全網為江蘇點贊!江蘇春晚賈旭明的諷刺小品爆火!

      草莓解說體育
      2026-02-21 16:46:28
      哭窮炫富,“知三當三”,裝了10年的吉克雋逸,還是“自食惡果”

      哭窮炫富,“知三當三”,裝了10年的吉克雋逸,還是“自食惡果”

      顧史
      2025-12-12 14:59:24
      學醫后才知道,腦梗最危險信號,不是手腳麻,而是頻繁出現3癥狀

      學醫后才知道,腦梗最危險信號,不是手腳麻,而是頻繁出現3癥狀

      風雨與陽光
      2026-02-11 19:13:07
      摔倒被扶反索賠22萬后續:律師發聲,案件焦點已明,賠償跑不掉了

      摔倒被扶反索賠22萬后續:律師發聲,案件焦點已明,賠償跑不掉了

      愛下廚的阿釃
      2026-02-21 06:55:42
      大年初六是:馬日,牢記:一不洗,二不吃,三人要穿紅,過吉祥年

      大年初六是:馬日,牢記:一不洗,二不吃,三人要穿紅,過吉祥年

      第一名廚官方
      2026-02-22 05:35:05
      文章沒想到,網友玩笑“馬年喝伊利就找馬伊琍”,竟在14天內成真

      文章沒想到,網友玩笑“馬年喝伊利就找馬伊琍”,竟在14天內成真

      一盅情懷
      2026-02-14 13:57:26
      中國科學家發現黃鐵礦能煉出黃金,簡單來說就是:黃金可以長出來

      中國科學家發現黃鐵礦能煉出黃金,簡單來說就是:黃金可以長出來

      暮雨咋歇著
      2026-02-16 13:16:15
      2026-02-22 06:23:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      12186文章數 176389關注度
      往期回顧 全部

      科技要聞

      智譜上市1月漲5倍,市值超越京東、快手

      頭條要聞

      貝加爾湖7名遇難者身份全部確認 1家4口僅1人生還

      頭條要聞

      貝加爾湖7名遇難者身份全部確認 1家4口僅1人生還

      體育要聞

      徐夢桃:這是我第一塊銅牌 給我換個吉祥物

      娛樂要聞

      黃曉明澳門賭博輸十幾億 本人親自回應

      財經要聞

      一覺醒來,世界大變,特朗普改新打法了

      汽車要聞

      比亞迪的“顏值擔當”來了 方程豹首款轎車路跑信息曝光

      態度原創

      旅游
      藝術
      手機
      公開課
      軍事航空

      旅游要聞

      上海的氣韻 | 馬上啟程來上博,博物館里過大年

      藝術要聞

      他的肖像畫和人體畫,竟讓人贊嘆不已!

      手機要聞

      三星Galaxy S26系列顏色曝光:將推6種配色,兩款為線上專屬

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      硬核揭秘!福建艦“一馬當先”底氣何在

      無障礙瀏覽 進入關懷版