<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Qwen負責人轉發2025寶藏論文,年底重讀「視覺領域GPT時刻」

      0
      分享至

      聞樂 發自 凹非寺
      量子位 | 公眾號 QbitAI

      2025最后幾天,是時候來看點年度寶藏論文了。

      比如,阿里最年輕P10、Qwen大模型技術負責人林俊旸最新轉發了一篇名為《Video models are zero-shot learners and reasoners》的研究。

      沒錯,就是谷歌DeepMind提出視頻模型“思維鏈”CoF的那篇入選ICCV 2025的論文。

      當時,這篇研究還給出了一個關鍵信號:視覺領域的“GPT時刻”要來了。



      該研究用1.8萬組實驗數據證明,視頻模型正在跳出任務專屬的局限,走上LLM的老路——

      用一個模型,通過提示,完成幾乎所有的視覺任務

      并且,推理過程還能被CoF“演”出來。

      從NLP到CV

      自然語言處理領域的GPT時刻,核心是實現了一個模型通吃所有

      在此之前,翻譯、寫作、問答等任務都各自有專屬的模型,而LLM的出現,靠大規模數據訓練和生成式架構,讓零樣本學習成為可能,模型通過文字提示就能完成各種各樣的任務。

      但計算機視覺領域卻還一直深陷于這種碎片化的困境。

      比如,要做目標檢測得用YOLO,做語義分割依賴SAM,圖像超分要找專門模型,3D重建還得換另一套工具。

      這些針對不同任務的模型架構差異很大,不僅開發成本高,還嚴重限制了視覺AI的泛化能力,導致視覺AI的進步一直是單點突破。

      比如這個模型在分割任務上刷新SOTA,另一個模型在檢測任務上實現提速,卻始終沒能解決“多任務統一”的問題。



      而這篇論文詳解了谷歌DeepMind借鑒LLM的成功路徑,讓Veo 3成為了一個“視覺通才”。

      通過大規模視頻與文本數據的生成式訓練,打通了視覺感知與語言理解的壁壘,讓模型具備了跨任務的通用能力



      而且Veo 3完美復刻了LLM的零樣本優勢,面對沒專門訓練過的任務,只要用文字說清需求,模型就能直接輸出結果,無需額外調參或數據微調。

      這也正是說視覺GPT時刻到來的核心標志。

      從生成視頻到用視頻思考

      就像林俊旸提到的那樣,這篇論文指出視頻模型一個非常關鍵的變化在于——視頻不再只是輸出的形式,也開始體現推理的過程。

      模型在生成視頻的過程中,會逐步展開中間狀態,這就讓推理不再是完全不可見的黑箱。

      論文中將這種現象稱為Chain-of-Frames,也就是CoF,類似于語言模型中的CoT,只不過視頻模型是通過連續生成的視頻幀,把整個推理過程“演”出來。

      模型在時間和空間中不斷調整畫面,用可見的變化替代抽象的符號推理。



      因此,無論是解迷宮、做路徑規劃,還是進行規則外推,模型都不是一次性輸出結果,而是在連續的視覺變化中逐步逼近正確解。

      推理過程則被隱含地編碼在視頻序列之中,視頻模型開始在過程中思考

      正是這種“逐幀生成即推理”的方式,為通用性提供了基礎。
      因為模型不再圍繞某一個具體任務去算結果,轉而在統一的生成過程中,不斷更新對場景狀態的理解。

      不同任務之間的差異,不再體現在模型結構或輸出形式上,而是被壓縮成了“生成過程中關注什么、如何繼續生成”的差別。

      這種框架下,分割、檢測、編輯、路徑規劃等原本割裂的視覺任務,可以被統一到同一套生成機制中。模型始終做的只有一件事:生成下一幀視頻

      在逐幀生成過程中,它自然完成了感知、推理與決策的協同,這就不再需要為每類任務單獨設計模型或系統。

      論文進一步觀察到,在無需針對具體任務進行專門訓練、也不引入額外監督的前提下,視頻模型已經能夠通過不同形式的提示,在多類視覺任務中展現出一定的零樣本泛化能力。

      也正因為如此,Veo 3用感知、建模、操控、推理4大核心能力能搞定62種沒學過的視覺任務。



      現在經過a16z投資合伙人Justine Moore和林俊旸一提醒,回看這篇論文發現,視頻模型在視覺領域的的突破,還真有點當年LLM顛覆NLP的味兒了……

      論文地址:https://arxiv.org/abs/2509.20328
      參考鏈接:https://x.com/venturetwins/status/2005330176977293743

      — 完 —

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      三眼花翎為何那么貴重,整個清朝只有7人獲得,和珅都沒得到

      三眼花翎為何那么貴重,整個清朝只有7人獲得,和珅都沒得到

      銘記歷史呀
      2025-12-30 00:27:08
      2026年1月1日俄將啟動與中國合作的國際超前發展區

      2026年1月1日俄將啟動與中國合作的國際超前發展區

      俄羅斯衛星通訊社
      2025-12-29 15:36:54
      陜中二附院王秦安醫生去世,年僅60歲剛退休,確診胰腺癌僅10個月

      陜中二附院王秦安醫生去世,年僅60歲剛退休,確診胰腺癌僅10個月

      180視角
      2025-12-29 11:29:03
      泰國輿論炸鍋,打了勝仗,簽協議時卻做出重大妥協,阿努廷危險了

      泰國輿論炸鍋,打了勝仗,簽協議時卻做出重大妥協,阿努廷危險了

      跳跳歷史
      2025-12-29 13:31:38
      F-16V鎖定空警-500預警機?

      F-16V鎖定空警-500預警機?

      武器縱論
      2025-12-29 22:33:29
      6年了,郭麒麟的反擊幾乎斷送了朱亞文的演藝生涯

      6年了,郭麒麟的反擊幾乎斷送了朱亞文的演藝生涯

      小熊侃史
      2025-12-25 11:24:12
      薩達姆到底有多兇殘?據其情人回憶:只要他還活著,我便時刻膽戰心驚!

      薩達姆到底有多兇殘?據其情人回憶:只要他還活著,我便時刻膽戰心驚!

      清風鑒史
      2025-12-29 21:21:17
      西班牙媒體評新世紀最佳運動員:梅西僅第二!C羅無緣前三!

      西班牙媒體評新世紀最佳運動員:梅西僅第二!C羅無緣前三!

      氧氣是個地鐵
      2025-12-29 18:48:57
      挑釁原配、“睡”遍京圈,定居美國7年的徐靜蕾,私生活太狂野了

      挑釁原配、“睡”遍京圈,定居美國7年的徐靜蕾,私生活太狂野了

      時光在作祟
      2025-12-27 18:37:45
      一個無聊得只能看書的民族,為何經濟卻能穩居世界前列?

      一個無聊得只能看書的民族,為何經濟卻能穩居世界前列?

      尚曦讀史
      2025-12-28 08:40:11
      年終報道丨美國在混亂與撕裂中走向治理失序

      年終報道丨美國在混亂與撕裂中走向治理失序

      北青網-北京青年報
      2025-12-29 20:59:03
      間隔不到2小時,章子怡、汪峰先后發文,網友:終究是森林北輸了

      間隔不到2小時,章子怡、汪峰先后發文,網友:終究是森林北輸了

      白面書誏
      2025-12-29 16:05:58
      手握1萬億美元順差,我們卻徹底搞錯了貿易的本質

      手握1萬億美元順差,我們卻徹底搞錯了貿易的本質

      流蘇晚晴
      2025-12-28 17:20:09
      海南封關運作后,就相當于中國版的新加坡正式上線了。

      海南封關運作后,就相當于中國版的新加坡正式上線了。

      流蘇晚晴
      2025-12-21 16:05:12
      成都蓉城新帥浮出水面,很快到位,徐正源最佳替代者,有3大優勢

      成都蓉城新帥浮出水面,很快到位,徐正源最佳替代者,有3大優勢

      零度眼看球
      2025-12-30 09:15:07
      山西省人民政府任免通知

      山西省人民政府任免通知

      山西經濟日報
      2025-12-30 09:56:47
      批判性思維:《當美國人被一條“斬殺線”擊中……》的邏輯分析

      批判性思維:《當美國人被一條“斬殺線”擊中……》的邏輯分析

      老頭和你隨便聊聊
      2025-12-29 12:25:12
      廣東3消息!徐杰公開質疑裁判,崔永熙主動請戰,杜鋒殘酷發聲

      廣東3消息!徐杰公開質疑裁判,崔永熙主動請戰,杜鋒殘酷發聲

      多特體育說
      2025-12-29 22:47:26
      26歲的周恩來擔任黃埔軍校政治部主任,老蔣:此人之才,勝我十倍

      26歲的周恩來擔任黃埔軍校政治部主任,老蔣:此人之才,勝我十倍

      鶴羽說個事
      2025-12-29 15:47:42
      爸把18套房全給私生子,宣讀遺囑時媽竟在笑,半年后我才知真相

      爸把18套房全給私生子,宣讀遺囑時媽竟在笑,半年后我才知真相

      溫情郵局
      2025-12-08 11:29:02
      2025-12-30 10:39:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      11942文章數 176346關注度
      往期回顧 全部

      科技要聞

      Manus官宣加入Meta,收購金額達數十億美金

      頭條要聞

      媒體:賴清德稱"大陸不敢越雷池" 第二天解放軍就演習

      頭條要聞

      媒體:賴清德稱"大陸不敢越雷池" 第二天解放軍就演習

      體育要聞

      這個59歲的胖子,還在表演“蝎子擺尾”

      娛樂要聞

      44歲林俊杰官宣戀情 帶23歲女友見家長

      財經要聞

      翁杰明:宏觀數據與居民微觀感受存在差距

      汽車要聞

      標配華為乾崑ADS 4 Pro 華境S明年上半年上市

      態度原創

      教育
      房產
      時尚
      健康
      游戲

      教育要聞

      湖南中醫大學湖北分數線揭秘!別慌!

      房產要聞

      中旅?三亞藍灣展示中心璀璨綻放,共鑒灣心孤品傳奇

      碧姬·芭鐸,“穿衣自由”概念的祖師奶

      這些新療法,讓化療不再那么痛苦

      ShadPS4模擬器重大突破:《血源》成功運行在線功能

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 妺妺窝人体色WWW看人体| 日本欧美一区二区免费视频 | 无码人妻精品一区二区三区蜜臀百度 | 色播久久人人爽人人爽人人片av| 泸定县| 精品九九视频| 无码中文字幕人妻在线一区| 亚洲韩国精品无码一区二区三区| 狠狠操狠狠| 91制片厂天美传媒网站进入| 国产自在自线午夜精品| 人妻夜夜爽天天爽一区| 国产成人无码一二三区视频| 超碰aⅴ人人做人人爽欧美| 久久国产欧美日韩精品图片| 午夜不卡久久精品无码免费| 亚洲毛多水多男女| 99久久人妻无码精品系列蜜桃| 亚洲熟女综合色一区二区三区 | 亚洲 自拍 另类 欧美 综合| 免费萌白酱国产一区二区三区| 成人a网站| 国产足交| 97人人看| 亚洲福利| 在线看免费无码的av天堂| 高要市| 秋霞鲁丝片成人无码国产| 亚洲无码2| 神马视频| 91视频久久| 安溪县| 思思热在线视频精品| 爱啪啪av导航| 日日噜噜噜夜夜爽爽狠狠视频 | 成在线人视频免费视频| 中文日产乱幕九区无线码| 99久久伊人精品综合观看| 农民人伦一区二区三区| 精品国产青草久久久久福利 | 日韩av无码精品一二三区|