![]()
當大語言模型通過 Test-time Scaling(推理時計算擴展)在邏輯推理上不僅 “讀萬卷書”,更能 “行萬里路” 時,計算機視覺的 “System 2” 時刻也已悄然降臨。
從單純的像素感知,到構建符合物理規律的世界模型(World Models);從平面的模式識別,到復雜的空間推理(Spatial Reasoning)—— 視覺智能正站在新范式的路口。
2026 年 6 月,CVPR 第二屆計算機視覺推理擴展研討會(ViSCALE 2026) 將在美國重磅回歸!繼首屆研討會成功開啟 TTS 在視覺領域的無限可能后,本屆 ViSCALE 由來自清華、普林斯頓、UC Santa Cruz、NUS等全球頂尖機構的學者聯合舉辦,將匯聚全球頂尖學者,共同探索如何讓視覺模型通過計算擴展突破現有模型的能力瓶頸。
![]()
研討會亮點:重新定義 “看” 與 “想”
如果說上一代視覺模型是 “直覺反應”,ViSCALE 關注的則是深度推理。我們不再滿足于靜態的輸出,而是探索模型如何在測試時動態分配計算資源,實現從 “看懂畫面” 到 “模擬世界” 的躍遷。
我們將重點探討:
- 世界模型與視頻生成: 如何利用 TTS 提升視頻生成的物理一致性與長時序因果推理能力?
- 空間與幾何推理: 突破 2D 限制,讓模型在 3D 空間中具備類似人類的導航與操作直覺。
- 視覺思維鏈 (Visual CoT): 像 LLM Reasoning 一樣,讓視覺模型學會 “反思”、“自我修正” 與多步推理。
- 推理擴展律 (Scaling Laws): 探索測試時計算量與視覺推理性能之間的 Scaling Law。
ViSCALE 已經邀請到包括 Sergey Levine, Manling Li, Ziwei Liu 在內的諸多學界和業界頂尖學者,將會圍繞空間智能、世界模型等計算機視覺領域新興的熱點話題展開討論,期待碰撞出新的火花。
論文征稿 (Call for Papers)
我們要尋找的,是能打破現有視覺模型天花板的原創性研究。無論你是深耕理論,還是專注應用,ViSCALE 都是你展示成果的最佳舞臺。
核心議題包括但不限于:
- Test-time Scaling 的理論基礎與高效算法
- 世界模型、視頻生成與復雜決策中的推理擴展
- 具身智能與自動駕駛中的長時序空間推理
- 統一模型中的推理擴展問題
- Visual Chain-of-Thought 與模型可解釋性
- 推理擴展帶來的安全性、魯棒性與幻覺問題
研討會特別鼓勵提交新穎觀點和創意思路的研究,將會接受多種類型的投稿:
Track 1: 正式論文 (Full Papers)
- 收錄類型: Archival
- 篇幅限制: 8 頁 (不含參考文獻)
- 格式要求: 必須使用 CVPR 2026 Author Kit。
Track 2: 擴展摘要 (Extended Abstracts)
- 收錄類型: Non-Archival
- 篇幅限制: 不超過 4 頁 (不含參考文獻)
- 格式要求: 需使用 CVPR 2026 Author Kit。
重要日期:
- 截止日期: 2026 年 3 月 10 日 (AoE)
- 錄用通知: 2026 年 3 月 18 日
- 研討會時間: 2026 年 6 月 3 日或 4 日(半天,線上線下混合)
Test-time Scaling 作為一項前沿技術,正在為模型推理增強帶來革命性的變化。歡迎大家積極參與,踴躍投稿并參與討論。投稿方式和詳細信息參見:https://viscale.github.io/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.