<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek王炸:10倍壓縮率,97%解碼精度!上下文光學壓縮登場

      0
      分享至


      來自DeepSeek的最新研究:DeepSeek-OCR,一種探索通過光學2D映射來壓縮長上下文的新方法

      LLM處理長文本的計算成本,又有了新的破解思路。把長長的上下文,直接渲染成一張圖片,再喂給模型,這樣做的好處是,原本數千上萬個文本token,現在可能只需要幾百個視覺token就能表示,實現了信息的高效壓縮

      實驗結果相當驚人:

      在壓縮率小于10倍時(即文本token數是視覺token數的10倍以內),模型OCR解碼準確率高達97%

      即使在20倍的超高壓縮率下,準確率依然能保持在60% 左右

      在主流的文檔解析基準測試 OmniDocBench 上,DeepSeek-OCR 用更少的視覺token,實現了超越SOTA模型的性能

      更重要的是,這項技術不僅是科研探索,還具備極高的實用價值。在生產環境中,單臺A100-40G GPU每天就能處理超過20萬頁的文檔,為大模型訓練提供海量數據

      目前,相關的代碼和模型權重均已開源

      https://github.com/deepseek-ai/DeepSeek-OCR/

      https://huggingface.co/deepseek-ai/DeepSeek-OCR

      什么是“上下文光學壓縮”?

      LLM在處理長文本時,面臨的核心挑戰是其固有的二次方計算復雜度。隨著序列長度的增加,計算資源和時間會急劇增長。

      DeepSeek研究人員提出了一個反直覺卻又合乎邏輯的想法:利用視覺模態作為文本信息的壓縮媒介

      相比于一長串的數字文本token,一張包含同樣內容的文檔圖像,可以用遠少于前者的視覺token來表示。這就好比將一本書的內容拍成一張照片,這張照片本身就包含了所有的文字和排版信息

      這種“文本→圖像→視覺token”的轉換過程,就是所謂的上下文光學壓縮(Contexts Optical Compression)

      為了驗證這一想法,團隊構建了DeepSeek-OCR模型。從圖(a)的壓縮實驗中可以看出,視覺token數量和OCR解碼精度之間的權衡關系:


      64個視覺token(左側柱狀圖):當文本token數在600-700之間(壓縮率約10.5倍)時,精度為96.5%。隨著文本量增加到1200-1300(壓縮率接近20倍),精度下降到59.1%

      100個視覺token(右側柱狀圖):在600-700文本token(壓縮率6.7倍)時,精度高達98.5%。即使文本量增加,壓縮率達到12.6倍時,精度仍有87.1%

      這意味著,在10倍壓縮的范圍內,模型幾乎可以“無損”地從圖像中解碼出原文

      DeepSeek-OCR是如何實現的?

      DeepSeek-OCR的架構由兩部分組成:一個核心的編碼器DeepEncoder,和一個解碼器DeepSeek3B-MoE-A570M


      解碼器采用了高效的MoE(Mixture-of-Experts)架構,而整個系統的創新關鍵在于DeepEncoder

      為了在處理高分辨率圖像時,依然能保持較低的計算激活和可控的視覺token數量,DeepEncoder的架構設計非常巧妙,它串聯了三個關鍵組件:

      1.SAM-base (ViTDet):利用窗口注意力(window attention)機制處理局部感知,將輸入圖像(如1024x1024)分割成大量patch(如4096個)。由于是窗口注意力且模型規模不大(80M),激活值是可控的

      2.16倍卷積壓縮器:在特征進入全局注意力模塊前,通過一個2層卷積網絡進行16倍的下采樣,將視覺token數量從4096個銳減到256個

      3.CLIP-large (ViT):利用密集的全局注意力(dense global attention)機制提取視覺知識。由于輸入的token數量已經大幅減少,這里的計算開銷也變得可以接受

      這種“先局部處理,再壓縮,后全局理解”的串行設計,使得DeepEncoder能夠在處理高清圖像的同時,生成數量極少的視覺token,實現了內存和token的雙重壓縮

      效果炸裂,token用得還少

      在權威的文檔理解基準 OmniDocBench 上,DeepSeek-OCR展現了其卓越的實用性能。


      從上圖的性能對比中可以看出,DeepSeek-OCR(紅色圓點)在“平均每張圖的視覺token數”(橫軸)上處于最左側區域,意味著它使用的token數量最少。而在“整體性能(編輯距離)”(縱軸,越低越好)上,它卻達到了SOTA水平

      具體來看:

      僅用100個視覺token(Small模式),就超越了使用256個token的 GOT-OCR2.0

      使用不到800個視覺token(Gundam模式),性能就超過了需要 6000+ token的 MinerU2.0

      這充分證明,DeepSeek-OCR在實際應用中非常強大,并且由于其極高的token壓縮率,為未來的研究留下了更高的想象空間

      不止于OCR的“深度解析”

      除了常規的OCR能力,DeepSeek-OCR還具備對文檔內圖像進行深度解析的能力

      無論是金融研報里的圖表


      還是化學文獻里的分子式


      甚至是數學題中的幾何圖形,它都能進行結構化的解析和轉換


      此外,得益于其多語言的訓練數據,模型還能處理包括阿拉伯語、僧伽羅語在內的近百種語言的文檔

      未來構想:模擬人類記憶遺忘

      這項研究最引人遐想的部分,是它為實現LLM的記憶遺忘機制提供了一種可能的路徑

      研究人員將上下文光學壓縮與人類記憶的衰退過程進行了類比:


      近期記憶 (Recent Contexts):就像近處的物體,清晰可見。可以將其渲染成高分辨率圖像,用較多的視覺token來保留高保真信息

      遠期記憶 (Older Contexts):就像遠處的物體,逐漸模糊。可以將其漸進式地縮放成更小、更模糊的圖像,用更少的視覺token來表示,從而實現信息的自然遺忘和壓縮

      通過這種方式,模型可以在處理超長對話或文檔時,動態地為不同時期的上下文分配不同數量的計算資源,從而可能構建出一種理論上無限長上下文的架構。

      總而言之,DeepSeek-OCR不僅驗證了“上下文光學壓縮”這一新穎想法的可行性,還提供了一個性能強大、極具實用價值的開源模型,為解決LLM的長上下文難題開辟了一個全新的、充滿希望的方向。

      論文地址:

      http://github.com/deepseek-ai/DeepSeek-OCR

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      反轉了!臭豆腐賠償到位大頭被捐,女兒成眾矢之的,再找工作難了

      反轉了!臭豆腐賠償到位大頭被捐,女兒成眾矢之的,再找工作難了

      離離言幾許
      2026-03-01 12:08:32
      美以對伊朗動手,俄羅斯、歐盟、巴基斯坦等多方發聲

      美以對伊朗動手,俄羅斯、歐盟、巴基斯坦等多方發聲

      參考消息
      2026-02-28 22:08:44
      砍9分11籃板!中國男籃1米98奇兵正負值+21:郭士強用對他

      砍9分11籃板!中國男籃1米98奇兵正負值+21:郭士強用對他

      李喜林籃球絕殺
      2026-03-01 18:48:10
      狗咬人被摔死,狗主人帶9人復仇被60歲老人反殺!是正當防衛嗎?

      狗咬人被摔死,狗主人帶9人復仇被60歲老人反殺!是正當防衛嗎?

      何慕白
      2025-11-13 10:22:09
      椰樹太顛了!代言人婚紗照成網紅打卡地,“土味營銷”天花板!

      椰樹太顛了!代言人婚紗照成網紅打卡地,“土味營銷”天花板!

      LOGO研究所
      2026-03-01 11:19:49
      周末信息如何影響市場?明天是紅色星期一?還是黑色星期一?

      周末信息如何影響市場?明天是紅色星期一?還是黑色星期一?

      春江財富
      2026-03-01 08:39:41
      7億成本,《鏢人》虧損2億,吳京不服氣,一口氣立項了7部武俠片

      7億成本,《鏢人》虧損2億,吳京不服氣,一口氣立項了7部武俠片

      電影票房預告片
      2026-02-26 23:39:18
      你有知道哪些炸裂的秘密?網友:我有個秘密說出來肯定大家要笑死

      你有知道哪些炸裂的秘密?網友:我有個秘密說出來肯定大家要笑死

      帶你感受人間冷暖
      2026-01-29 00:10:05
      潛伏11年,那些被礦渣喂大的香蕉,終于開始向人類“復仇”了

      潛伏11年,那些被礦渣喂大的香蕉,終于開始向人類“復仇”了

      墨印齋
      2026-02-26 08:32:20
      金靖自曝過完年胖了6斤,怎么工作啊,網友調侃年味都長身上了

      金靖自曝過完年胖了6斤,怎么工作啊,網友調侃年味都長身上了

      韓小娛
      2026-03-01 09:57:40
      中東局勢升級 金價重回1600元 專家提醒:建議投資者逢高少量減持

      中東局勢升級 金價重回1600元 專家提醒:建議投資者逢高少量減持

      封面新聞
      2026-03-01 22:14:05
      抵債的方式能有多離譜?網友:賠了我八個車位

      抵債的方式能有多離譜?網友:賠了我八個車位

      另子維愛讀史
      2026-02-28 20:39:11
      網紅民宿降價也無人問津?這屆“摳門”的年輕人擠爆體制內招待所

      網紅民宿降價也無人問津?這屆“摳門”的年輕人擠爆體制內招待所

      藍鯨新聞
      2026-02-24 16:03:06
      中領館提醒: 18-65歲在俄長期居留男性 須同意在俄軍事單位等至少服役1年

      中領館提醒: 18-65歲在俄長期居留男性 須同意在俄軍事單位等至少服役1年

      閃電新聞
      2026-02-26 12:46:48
      男籃世預賽晉級形勢分析!中國隊1戰定生死:韓國或被聯手踢出局

      男籃世預賽晉級形勢分析!中國隊1戰定生死:韓國或被聯手踢出局

      籃球快餐車
      2026-03-01 00:42:22
      伊朗犯下10月7日的致命失誤,導致其失去一切

      伊朗犯下10月7日的致命失誤,導致其失去一切

      山河路口
      2026-03-01 20:25:18
      鄒市明一家國外度假,冉瑩穎挑染紅發似精神小妹,軒軒180cm超帥

      鄒市明一家國外度假,冉瑩穎挑染紅發似精神小妹,軒軒180cm超帥

      瘋說時尚
      2026-03-01 11:38:45
      美伊戰爭進入第二天,美軍投入大量新式武器,伊朗連射20輪導彈

      美伊戰爭進入第二天,美軍投入大量新式武器,伊朗連射20輪導彈

      鐵血戰史1927
      2026-03-01 18:37:15
      無錫二院!你要火了!

      無錫二院!你要火了!

      無錫eTV全媒體
      2026-03-01 11:46:51
      富士康創始人郭臺銘:“若兩岸爆發沖突,我會誓死守護臺灣”

      富士康創始人郭臺銘:“若兩岸爆發沖突,我會誓死守護臺灣”

      百態人間
      2026-02-12 15:21:00
      2026-03-01 23:32:49
      AI寒武紀 incentive-icons
      AI寒武紀
      專注于人工智能,科技領域
      1034文章數 396關注度
      往期回顧 全部

      科技要聞

      榮耀發布機器人手機、折疊屏、人形機器人

      頭條要聞

      在以貼瓷磚的中國小伙:爆炸聲在頭頂響起 真的被嚇到

      頭條要聞

      在以貼瓷磚的中國小伙:爆炸聲在頭頂響起 真的被嚇到

      體育要聞

      火箭輸給熱火:烏度卡又輸斯波教練

      娛樂要聞

      黃景瑜 李雪健坐鎮!38集犯罪大劇來襲

      財經要聞

      中東局勢升級 如何影響A股、黃金和原油

      汽車要聞

      理想汽車2月交付26421輛 歷史累計交付超159萬輛

      態度原創

      游戲
      教育
      本地
      公開課
      軍事航空

      LPL季后賽:IG復仇NIP,成功挺進下輪

      教育要聞

      中考數學復習,中考數學重難點二次函數,經典壓軸題,難度大

      本地新聞

      津南好·四時總相宜

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      伊朗前總統內賈德遇襲身亡

      無障礙瀏覽 進入關懷版