<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek-OCR是「長文本理解」未來方向?中科院VTCBench給出答案

      0
      分享至



      DeepSeek-OCR 的視覺文本壓縮(VTC)技術通過將文本編碼為視覺 Token,實現高達 10 倍的壓縮率,大幅降低大模型處理長文本的成本。但是,視覺語言模型能否理解壓縮后的高密度信息?中科院自動化所等推出 VTCBench 基準測試,評估模型在視覺空間中的認知極限,包括信息檢索、關聯推理和長期記憶三大任務。

      近期,DeepSeek-OCR 憑借其創新的「視覺文本壓縮」(Vision-Text Compression, VTC)范式引發了技術圈的高度關注,以極少的視覺 Token 實現高效的文本信息編碼,為長文本處理開辟了新路徑。

      這一突破性進展讓大模型處理超長文本的成本大幅降低,但也拋出了一個核心問題:當長文本被高度壓縮為 2D 圖像后,視覺語言模型(VLM)真的能理解其中的內容嗎?

      為了解答這一疑問,來自中科院自動化所、中國科學院香港創新研究院等機構的研究團隊推出了首個專門針對視覺 - 文本壓縮范式的基準測試 ——VTCBench。



      • 論文鏈接:https://arxiv.org/abs/2512.15649
      • VTCBench 鏈接: https://github.com/Moenupa/VTCBench
      • VLMEvalKit 鏈接:https://github.com/bjzhb666/VLMEvalKit
      • Huggingface 鏈接: https://huggingface.co/datasets/MLLM-CL/VTCBench



      圖 1:視覺 - 文本壓縮 (VTC) 流程演示及 VTCBench

      與傳統大模型直接讀取成千上萬的純文本 Token 不同,VTC 范式(如 DeepSeek-OCR)先將長文檔渲染 (Rendering)為高密度的 2D 圖像,再由視覺編碼器轉化為少量的視覺 Token。

      該技術可實現 2 倍至 10 倍的 Token 壓縮率,顯著降低了長文本處理時的計算與顯存開銷。

      VTCBench 現已在 GitHub 和 Huggingface 全面開源,其衍生版本 VTCBench-Wild 是一個統一的、全方位評估模型在復雜現實場景下視覺文本壓縮的魯棒性,現已集成到 VLMevalkit。

      核心使命——衡量「看得見」之后的「看得懂」

      目前的 VLM 也許能出色地完成 OCR 識別,但在處理 VTC 壓縮后的高密度信息時,其長文本理解能力仍存疑。

      VTCBench 通過三大任務,系統性地評估模型在視覺空間中的認知極限:

      1. VTC-Retrieval (信息檢索):在視覺「大海」中尋找特定事實的「針」(Needle-in-a-Haystack),測試模型對空間分布信息的捕捉能力;
      2. VTC-Reasoning (關聯推理):挑戰模型在幾乎沒有文本重疊的情況下,通過關聯推理尋找事實,超越單純的詞匯檢索;
      3. VTC-Memory (長期記憶):模擬超長對話,評估模型在視覺壓縮框架下,抵御時間與結構性信息衰減的能力。

      此外,團隊同步推出了 VTCBench-Wild,引入 99 種不同的渲染配置(涵蓋多種字體、字號、行高及背景),全方位檢測模型在復雜現實場景下的魯棒性。

      揭秘視覺壓縮背后的認知瓶頸



      圖 2:VTCBench 針對模型在長圖像中檢索信息的熱力圖。橫軸代表上下文長度,縱軸代表關鍵事實(Needle)在文檔中的深度。展現了模型表現的「迷失」與突破。

      測試結果呈現出顯著的 「U 型曲線」:與文本模型類似,視覺語言模型(VLM)能夠精準捕捉開頭和結尾的信息,但對于中間部分的事實,理解能力會隨著文檔變長而劇烈衰退。

      這證明了即使在視覺空間,模型依然存在嚴重的「空間注意力偏見」,是未來 VTC 架構優化的關鍵方向。

      行業洞察 —— 視覺壓縮是長文本的終局嗎?



      通過對 GPT、Gemini、Claude、QwenVL、InternVL、Gemma、KimiVL、Seed1.5 等 10 余種尖端模型的深度評測,可以發現:

      雖然 VTC 極大提升了效率,但現有 VLM 在復雜推理和記憶任務上的表現仍顯著弱于純文本 LLM;

      消融實驗證明,信息密度是決定模型性能的關鍵因素,直接影響視覺編碼器的識別精度;

      Gemini-3-Pro 在 VTCBench-Wild 上表現驚艷,其視覺理解能力已幾乎追平其純文本基準,證明了 VTC 是實現大規模長文本處理的極其可行的路徑!

      總結

      如果說傳統的長文本處理是「逐字閱讀」,那么, DeepSeek-OCR 所引領的 VTC 范式就是「過目成誦」的攝影式記憶。VTCBench 的出現,正是為了確保模型在擁有這種「超能力」的同時,依然能夠讀懂字里行間的微言大義。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      短短24小時驚天反轉,特朗普對31國發出通牒后,英法德當“逃兵”

      短短24小時驚天反轉,特朗普對31國發出通牒后,英法德當“逃兵”

      策略述
      2026-01-13 12:29:35
      青海獨家回應:4名評標專家“餓暈”當天經歷了什么

      青海獨家回應:4名評標專家“餓暈”當天經歷了什么

      中國新聞周刊
      2026-01-13 18:25:10
      商務部:自2026年1月14日起,對原產于美國和韓國的進口太陽能級多晶硅繼續征收反傾銷稅,實施期限為5年

      商務部:自2026年1月14日起,對原產于美國和韓國的進口太陽能級多晶硅繼續征收反傾銷稅,實施期限為5年

      每日經濟新聞
      2026-01-13 16:39:49
      人民網銳評中戲新疆班!言語犀利句句戳人心窩,誰在說謊一目了然

      人民網銳評中戲新疆班!言語犀利句句戳人心窩,誰在說謊一目了然

      李健政觀察
      2026-01-13 13:34:01
      印度網友:中國拍了那么多戰爭電影,可為啥從不拍關于中印的戰爭

      印度網友:中國拍了那么多戰爭電影,可為啥從不拍關于中印的戰爭

      李健政觀察
      2026-01-13 09:39:34
      網紅口子姐熬夜猝死,年僅29歲,去年得了梅毒,最后露面胖了太多

      網紅口子姐熬夜猝死,年僅29歲,去年得了梅毒,最后露面胖了太多

      180視角
      2026-01-13 10:10:53
      合川殺豬宴火到央視!人民日報點名,惡心事發生,網名呆呆難保住

      合川殺豬宴火到央視!人民日報點名,惡心事發生,網名呆呆難保住

      李健政觀察
      2026-01-13 14:55:06
      數百萬元現金用編織袋裝入醫院院長后備箱!官方披露一商業賄賂案

      數百萬元現金用編織袋裝入醫院院長后備箱!官方披露一商業賄賂案

      新京報
      2026-01-13 14:06:09
      暴跌,新股民的天塌了

      暴跌,新股民的天塌了

      曹多魚的財經世界
      2026-01-13 16:02:22
      悲催!珠海一33年工廠破產,幾百人飯碗沒了,涉及司法案件363條

      悲催!珠海一33年工廠破產,幾百人飯碗沒了,涉及司法案件363條

      火山詩話
      2026-01-13 13:15:14
      基隆一甜品店“青提”甜品被疑使用“大陸用語”甚至被嗆,島內網民:庸人自擾,無聊

      基隆一甜品店“青提”甜品被疑使用“大陸用語”甚至被嗆,島內網民:庸人自擾,無聊

      環球網資訊
      2026-01-13 09:29:09
      果然不出所料,委內瑞拉的石油“有問題”,只有中國能安穩開采!

      果然不出所料,委內瑞拉的石油“有問題”,只有中國能安穩開采!

      古事尋蹤記
      2026-01-13 07:10:23
      臺媒:臺立法機構確認“賴清德彈劾案”議程

      臺媒:臺立法機構確認“賴清德彈劾案”議程

      環球網資訊
      2026-01-13 17:23:11
      我國最“不靠譜”的三位專家,在央視“大放厥詞”,卻爆火34年

      我國最“不靠譜”的三位專家,在央視“大放厥詞”,卻爆火34年

      有范又有料
      2026-01-13 09:21:31
      1984年賀子珍在上海病逝,市委不敢定喪葬規格,鄧小平看后只說了一句話,結局出人意料

      1984年賀子珍在上海病逝,市委不敢定喪葬規格,鄧小平看后只說了一句話,結局出人意料

      歷史回憶室
      2026-01-11 22:43:10
      大V建議沒錢取暖的河北農村老人可以到海南云南兩廣旅居過冬

      大V建議沒錢取暖的河北農村老人可以到海南云南兩廣旅居過冬

      西虹市閑話
      2026-01-13 13:46:51
      剛剛,上海宣布大利好

      剛剛,上海宣布大利好

      中國基金報
      2026-01-13 11:53:34
      丹麥女首相為了討好美國,像瘋狗一樣咬中國,結果美國要吃它狗腿

      丹麥女首相為了討好美國,像瘋狗一樣咬中國,結果美國要吃它狗腿

      百態人間
      2026-01-12 16:23:16
      美國國務院要求美國公民立即離開伊朗

      美國國務院要求美國公民立即離開伊朗

      新華社
      2026-01-13 08:09:03
      4名專家因送餐延誤身體不適拒評標,青海省數據局通報

      4名專家因送餐延誤身體不適拒評標,青海省數據局通報

      澎湃新聞
      2026-01-12 23:44:04
      2026-01-13 20:12:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12110文章數 142535關注度
      往期回顧 全部

      科技要聞

      每年10億美元!谷歌大模型注入Siri

      頭條要聞

      美記者問伊朗是否被要求退出金磚國家軍演 外交部回應

      頭條要聞

      美記者問伊朗是否被要求退出金磚國家軍演 外交部回應

      體育要聞

      他帶出國乒世界冠軍,退休后為愛徒返場

      娛樂要聞

      周杰倫以球員身份參加澳網,C位海報公開

      財經要聞

      "天量存款"將到期 資金會否搬入股市?

      汽車要聞

      限時9.99萬元起 2026款啟辰大V DD-i虎鯨上市

      態度原創

      時尚
      游戲
      旅游
      健康
      公開課

      走過那個夏天,甜茶終于站上金球獎之巔

      白嫖門票!爐石競技模式牧師“灌注”被移除,新寵物伊瑟拉登場

      旅游要聞

      【海岱四季】雪落半島 美不勝收

      血常規3項異常,是身體警報!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 一区二区三区激情免费视频| 日本无码中出| 欧洲熟妇色xxxx欧美老妇性| 国产精品爽爽久久久久久蜜臀| 布尔津县| 伊人久久久| 亚洲aⅴ男人的天堂在线观看| 免费A级毛片中文字幕| 无码专区人妻系列日韩精品| 成人自拍偷拍| 亚洲一区二区三区播放| 中文字幕亚洲天堂| 久久综合激情网| 成人免费AV一区二区三区| 亚洲人成网站在线观看播放| 欧美超级乱婬视频播放| 亚洲精品在线视频自拍| 日韩精品一区二区三区在线观看| 色婷婷色| 2020久久香蕉国产线看观看 | 久久人人97超碰国产精品| 欧美一级黄色影院| 日韩美a一级毛片| 97亚洲熟妇自偷自拍另类图片 | 亚洲色偷偷色噜噜狠狠99 | 美女裸体自慰在线观看| 久久精品国产只有精品96| 99精品久久久中文字幕| 久久婷婷色| 国产高清一区二区三区视频| 亚洲第一成人网站| 夜夜嗨AV| 欧美色综合| V一区无码内射国产| 国产精品香蕉在线| 亚洲暴爽av天天爽日日碰| 又爽又黄又无遮掩的免费视频| 中文字幕日韩精品亚洲一区| 台中市| 国产成人精品无码片区在线观看| 4455免费|