<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      何愷明NeurIPS 2025演講盤點:視覺目標檢測三十年

      0
      分享至



      機器之心報道

      機器之心編輯部

      不久前,NeurIPS 2025 順利舉辦,作為人工智能學術界的頂級會議之一,其中不乏學術界大佬的工作和演講。

      有一項榮譽的頒發顯得格外厚重且眾望所歸 —— 由任少卿、何愷明、Ross Girshick 和孫劍合著的經典論文《Faster R-CNN》,摘得了「時間檢驗獎」 (Test of Time Award)

      凡是接觸過計算機視覺的人,對這個名字絕不陌生。自 2015 年發表以來,《Faster R-CNN》無疑成為了該領域最具里程碑意義的工作之一。它不僅一舉奠定了現代目標檢測框架的核心范式,更像是一座燈塔,深刻影響并指引了隨后整整十年的視覺模型發展方向。



      • 論文地址:https://arxiv.org/pdf/1506.01497



      作為這一歷史性時刻的見證與總結,何愷明在大會上發表了題為《視覺目標檢測簡史》 (A Brief History of Visual Object Detection)的演講。



      何愷明演講 PPT 已經公開,可以參閱以下鏈接:

      https://people.csail.mit.edu/kaiming/neurips2025talk/neurips2025_fasterrcnn_kaiming.pdf

      從何愷明的演講內容來看,這不單是一個技術匯報,更像是一部計算機如何學會「看世界」的英雄史詩,總結了 30 年來視覺目標檢測的發展歷程。演講中介紹的每一個工作,都獲得了不同頂會的時間檢驗獎,對視覺智能的發展起到了決定性的作用。

      你是否好奇:為什么現在的 AI 能在一瞬間識別出照片里的貓、狗、汽車甚至它們的位置,而在十幾年前這卻被認為是幾乎不可能的任務?



      讓我們跟隨大神的視角,穿越回那個「原始」的時代,看看這一路是如何走來的。

      原始:手工打磨的「放大鏡」

      在深度學習爆發之前,計算機視覺科學家們更像是「工匠」。

      人臉檢測的早期嘗試: 早在 90 年代,科學家們就開始嘗試用神經網絡和統計學方法找人臉:

      • 1996 年: Rowley 等人發表了《基于神經網絡的人臉檢測》(Neural Network-Based Face Detection) ,這是何愷明閱讀的第一篇 CV 論文,利用早期的神經網絡在圖像金字塔上尋找面孔 。
      • 1997 年: Osuna 等人引入了支持向量機,發表了《用于人臉檢測的 SVM》(SVM for Face Detection) ,試圖在數據中畫出一條完美的分類線。
      • 2001 年: 著名的Viola-Jones 框架(The Viola-Jones Framework) 橫空出世。它通過簡單的特征組合實現了極快的人臉檢測,直到今天,很多老式相機的對焦功能還得感謝它。

      特征工程的黃金時代: 既然「整張臉」難找,那就找「關鍵點」和「紋理」。隨后的幾年,特征描述符成為了主角:

      • 1999 年: Lowe 提出了SIFT,這種「尺度不變特征變換」能在旋轉、縮放的情況下依然認出物體,是當年的絕對王者。
      • 2003 年: Sivic 和 Zisserman 借鑒文本搜索,提出了「視覺詞袋模型」(Bag of Visual Words) ,把圖片看作一堆「視覺單詞」的集合。
      • 2005 年: Dalal 和 Triggs 發明了HOG(方向梯度直方圖) ,專門用來描述行人的輪廓。同一年,Grauman 和 Darrell 提出了 「金字塔匹配核」 (Pyramid Match Kernel) ,用來比較兩組特征的相似度。
      • 2006 年: Lazebnik 等人進一步提出了「空間金字塔匹配」(Spatial Pyramid Matching) ,解決了詞袋模型丟失空間位置信息的問題。
      • 2008 年: 特征工程的集大成者DPM(Deformable Part Model) 登場。它把物體看作一個個可變形的部件(比如人的頭、手、腳),像彈簧一樣連接在一起。這是傳統方法的巔峰。

      痛點在哪里?特征是人設計的(Hand-crafted),分類器(比如 SVM)只能在這些有限的信息上工作 。這種方法不僅慢,而且很難適應復雜的場景。

      破曉:AlexNet 與 R-CNN 的「暴力美學」

      2012 年,AlexNet 橫空出世,深度學習證明了它提取特征的能力遠超人類手工設計 。但是,怎么用它來做目標檢測呢?

      深度學習的驚雷:2012 年,AlexNet (Krizhevsky et al.) 在 ImageNet 競賽中以壓倒性優勢奪冠。它證明了深層卷積神經網絡(CNN)提取特征的能力遠超人類手工設計。



      R-CNN:從分類到檢測 但是,怎么用 CNN 做目標檢測(框出物體位置)? 2014 年,Girshick 等人提出了劃時代的 R-CNN (Region-based CNN) 。它的思路很直接:

      • 先用傳統算法(Selective Search)在圖上剪出約 2000 個「候選區域」 (Region Proposals)。
      • 把每個區域都扔進 CNN 提特征,再用 SVM 分類。

      巔峰:Faster R-CNN 的「速度進化」

      R-CNN 讓每個候選框都過一遍 CNN,計算量巨大。科學家們開始思考如何復用計算。

      • 2014 年: 何愷明團隊提出了SPP-Net(Spatial Pyramid Pooling) 。它引入了空間金字塔池化層,允許神經網絡處理任意大小的圖片,并且只算一次全圖特征,大大加速了檢測。
      • 2015 年: Girshick 借鑒 SPP-Net,推出了Fast R-CNN。它引入了 RoI Pooling,把特征提取和分類回歸整合到了一個網絡里,不僅快,還能端到端訓練。



      最終的瓶頸: 即便如此,候選框(Region Proposals)依然依賴那個笨重的傳統算法(Selective Search),這成為了系統的速度瓶頸。



      2015 年,Faster R-CNN 的誕生:何愷明團隊提出了 RPN (Region Proposal Network) 。他們從 1991 年 LeCun 等人的 「空間位移神經網絡」 (Space Displacement Net) 中獲得靈感,讓神經網絡自己在特征圖上「滑動」,通過預設的 Anchor (錨點) 來預測物體可能存在的位置。

      至此,目標檢測的所有環節 —— 提議、特征提取、分類、回歸 —— 全部被神經網絡接管,實現了真正的「端到端」實時檢測。速度和精度雙重飛躍,計算機視覺終于邁入了實時檢測的時代。

      迷霧后的新世界:Transformer 與萬物

      Faster R-CNN 開啟了一個時代,但探索從未停止。演講的后半部分,何愷明展示了技術的洪流如何繼續奔涌:

      既然要快,能不能連「候選框」這個步驟都不要了?

      • 2016 年:YOLO(You Only Look Once) 和SSD(Single Shot MultiBox Detector) 問世。它們像人類一眼看全圖一樣,直接輸出所有物體的位置和類別,速度極快。
      • 2017 年: 為了解決單階段檢測精度低的問題(正負樣本不平衡),何愷明團隊提出了Focal Loss(RetinaNet) 。
      • 2017 年:Mask R-CNN驚艷亮相。它在 Faster R-CNN 的基礎上加了一個分支,不僅能畫框,還能像素級地把物體「摳」出來(實例分割),引入了 RoI Align 解決了像素對齊問題。
      • 2020 年:DETR(Detection Transformer) 將 Transformer 架構引入視覺。它完全拋棄了 Anchor 和復雜的后處理(NMS),用全局注意力機制重新定義了檢測。
      • 2023 年:SAM(Segment Anything Model) 橫空出世。它在大數據的喂養下,學會了「分割萬物」,不再受限于特定的訓練類別,展示了視覺大模型的雛形。



      在這個「大航海時代」我們學到了什么?

      我們在過去的幾十年里學到了什么?

      何愷明說:「Write object detection papers and win Test of Time Awards :)」(寫目標檢測論文然后拿到時間檢驗獎 :) )

      演講最后,他用一張 Nano-Banana 生成的非常有寓意的圖作為結尾:一艘船駛向迷霧中的大海。



      他說,科學探索就像是駛入迷霧

      • 這里沒有預先畫好的的地圖。
      • 我們甚至不知道終點是否存在 。

      從手工特征到 CNN,再到 Transformer,每一次飛躍都是探險者在迷霧中發現的新大陸。Faster R-CNN 不僅僅是一個算法,它教會了我們:當舊的組件成為瓶頸時,用更強大的可學習模型去取代它。

      在下一個十年,計算機視覺的「圣杯」會是什么?

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      75年,毛澤東和周恩來同時患上重病,毛澤東問周恩來:江山靠誰守

      75年,毛澤東和周恩來同時患上重病,毛澤東問周恩來:江山靠誰守

      南書房
      2025-12-11 12:25:08
      拿600萬!全場得2分,正負值-8,邱彪怒批:國內核心沒有好好打球

      拿600萬!全場得2分,正負值-8,邱彪怒批:國內核心沒有好好打球

      南海浪花
      2025-12-18 07:13:18
      何晴真正死因曝光!2年前復發,癌細胞轉移肺腦干,導致無法手術

      何晴真正死因曝光!2年前復發,癌細胞轉移肺腦干,導致無法手術

      小徐講八卦
      2025-12-17 14:02:53
      巴黎最弱1環?31歲隊長洲際杯成臥底 離譜送點+讀秒空門絕殺踢呲

      巴黎最弱1環?31歲隊長洲際杯成臥底 離譜送點+讀秒空門絕殺踢呲

      我愛英超
      2025-12-18 05:16:21
      收到工資1002415.13元,愛你華為。

      收到工資1002415.13元,愛你華為。

      純潔的微笑
      2025-12-12 21:29:39
      重慶“文強”之子的現狀

      重慶“文強”之子的現狀

      年代回憶
      2025-05-13 20:05:32
      首曬孕肚曝體重,馬筱梅邊曬幸福邊講汪小菲黑料,流量密碼巧拿捏

      首曬孕肚曝體重,馬筱梅邊曬幸福邊講汪小菲黑料,流量密碼巧拿捏

      寄予的清風
      2025-12-15 21:03:43
      國乒12.16日:多哈賽名單,四人重用 四大名被棄,王曼昱有望世一

      國乒12.16日:多哈賽名單,四人重用 四大名被棄,王曼昱有望世一

      民間平哥
      2025-12-17 20:07:55
      邪惡實驗:6女4男船上共處100天無法律約束,結果揭秘

      邪惡實驗:6女4男船上共處100天無法律約束,結果揭秘

      王嚾曉
      2025-12-17 13:19:55
      王俊凱也沒想到,自己和全紅嬋的互動,竟無意間扭轉全紅嬋的口碑

      王俊凱也沒想到,自己和全紅嬋的互動,竟無意間扭轉全紅嬋的口碑

      甜菊汽水
      2025-12-18 02:48:52
      2018年巔峰身價達到1億歐,伊卡爾迪如今德轉身價僅為600萬

      2018年巔峰身價達到1億歐,伊卡爾迪如今德轉身價僅為600萬

      懂球帝
      2025-12-17 23:28:24
      杜蘭特:2019年總決賽沒人提醒我帶傷打會跟腱斷裂,不然我可能不會上

      杜蘭特:2019年總決賽沒人提醒我帶傷打會跟腱斷裂,不然我可能不會上

      懂球帝
      2025-12-18 11:18:56
      不打了!哈登缺席比賽,快船僅4人不可交易,待大將回歸沖附加賽

      不打了!哈登缺席比賽,快船僅4人不可交易,待大將回歸沖附加賽

      煙潯渺渺
      2025-12-18 09:38:25
      香港一找換店職員稱被4名持刀男子劫走10億日元,警方已拘捕一人

      香港一找換店職員稱被4名持刀男子劫走10億日元,警方已拘捕一人

      中國能源網
      2025-12-18 11:42:37
      楊冪周柯宇深夜“打游戲”的瓜!

      楊冪周柯宇深夜“打游戲”的瓜!

      八卦瘋叔
      2025-12-18 10:19:06
      片約不斷,卻演啥毀啥?《長安二十四計》這“戲混子”,該醒醒了

      片約不斷,卻演啥毀啥?《長安二十四計》這“戲混子”,該醒醒了

      歸史
      2025-12-18 11:42:00
      場均25.6分!年薪近4000萬,小波特交易價值如何?

      場均25.6分!年薪近4000萬,小波特交易價值如何?

      籃球實錄
      2025-12-18 12:18:14
      特斯拉發文:一味堆電池只會增加車重,一些車100度電池續航也沒超過Model 3

      特斯拉發文:一味堆電池只會增加車重,一些車100度電池續航也沒超過Model 3

      金融界
      2025-12-16 16:52:45
      毛主席曾留七大預言:當時沒人信,如今6個已應驗,第7個即將實現

      毛主席曾留七大預言:當時沒人信,如今6個已應驗,第7個即將實現

      秀心文雅
      2025-09-13 10:25:44
      《阿凡達3》預售票房斷崖式下跌,網友:這票價他們也是真敢開口

      《阿凡達3》預售票房斷崖式下跌,網友:這票價他們也是真敢開口

      星宿影視鴨
      2025-12-17 14:53:49
      2025-12-18 13:11:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11944文章數 142512關注度
      往期回顧 全部

      科技要聞

      谷歌凌晨炸場,Pro級智商只賣“白菜價”

      頭條要聞

      牛彈琴:泰柬激烈沖突泰軍占上風 中國又出手了

      頭條要聞

      牛彈琴:泰柬激烈沖突泰軍占上風 中國又出手了

      體育要聞

      巴黎首奪世界級冠軍 加冕6冠王比肩巴薩拜仁

      娛樂要聞

      內娛解約大戰:鞠婧祎和絲芭,誰是狼人

      財經要聞

      重大改革,身關14億人的政策徹底變了!

      汽車要聞

      開箱日產大沙發 精致辦公or躺平追劇 哪個更適配?

      態度原創

      房產
      親子
      數碼
      教育
      時尚

      房產要聞

      太強了!封關時刻,兩天砸下50億!央企綠發,重倉三亞!

      親子要聞

      2025年幼兒園家具品牌推薦,飛友以“一米高度”設計溫暖每一所幼兒園

      數碼要聞

      華為全新MatePad 11.5宣布12月22日發布 類自然光顯示 更護眼

      教育要聞

      吉林財經大學值得報考嗎?就業+實習全托底,值得中分段學生關注!

      今年一定要擁有這件“爆火單品”,讓你美出新高度

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: [无码破解]AV破解版HD在线观看| 日日碰狠狠躁久久躁96avv| 粗壮挺进人妻水蜜桃成熟| 国产精品久久毛片av大全日韩| 伊人综合成人| 五月婷婷开心| 久久一日本道色综合久久| 亚洲成人高清无码| 国内老熟妇对白hdxxxx| 成人乱人伦精品小说| 安陆市| 精品综合视频精品| 亚洲国产性夜夜综合| 国产乱子伦一区二区三区| 国产成人一区二区三区别| 国产在线网址| 国产精品18| 国产午夜精品理论大片| 欧美肥妇多毛bbw| 成人性生交大片免费看r链接| 国产综合久久久久鬼色| 肇东市| 人草逼视频频| 国产中文在线| 干老熟女干老穴干老女人| 成在线人永久免费视频播放 | 91视频在线观看视频| 在线免费熟女| 中文字幕av高清片| 少妇一边呻吟一边说使劲视频| 狠狠人妻久久久久久综合果冻| 华宁县| 国产色AV| 极品虎白一线天馒头最新消息| 东京热av无码电影一区二区| 隔壁人妻偷人bd中字| 国内女人喷潮完整视频| 国产l精品国产亚洲区| 99在线视频免费观看| 超碰人妻在线| 超碰99热|