<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek王炸:10倍壓縮率,97%解碼精度!上下文光學壓縮登場

      0
      分享至


      來自DeepSeek的最新研究:DeepSeek-OCR,一種探索通過光學2D映射來壓縮長上下文的新方法

      LLM處理長文本的計算成本,又有了新的破解思路。把長長的上下文,直接渲染成一張圖片,再喂給模型,這樣做的好處是,原本數千上萬個文本token,現在可能只需要幾百個視覺token就能表示,實現了信息的高效壓縮

      實驗結果相當驚人:

      在壓縮率小于10倍時(即文本token數是視覺token數的10倍以內),模型OCR解碼準確率高達97%

      即使在20倍的超高壓縮率下,準確率依然能保持在60% 左右

      在主流的文檔解析基準測試 OmniDocBench 上,DeepSeek-OCR 用更少的視覺token,實現了超越SOTA模型的性能

      更重要的是,這項技術不僅是科研探索,還具備極高的實用價值。在生產環境中,單臺A100-40G GPU每天就能處理超過20萬頁的文檔,為大模型訓練提供海量數據

      目前,相關的代碼和模型權重均已開源

      https://github.com/deepseek-ai/DeepSeek-OCR/

      https://huggingface.co/deepseek-ai/DeepSeek-OCR

      什么是“上下文光學壓縮”?

      LLM在處理長文本時,面臨的核心挑戰是其固有的二次方計算復雜度。隨著序列長度的增加,計算資源和時間會急劇增長。

      DeepSeek研究人員提出了一個反直覺卻又合乎邏輯的想法:利用視覺模態作為文本信息的壓縮媒介

      相比于一長串的數字文本token,一張包含同樣內容的文檔圖像,可以用遠少于前者的視覺token來表示。這就好比將一本書的內容拍成一張照片,這張照片本身就包含了所有的文字和排版信息

      這種“文本→圖像→視覺token”的轉換過程,就是所謂的上下文光學壓縮(Contexts Optical Compression)

      為了驗證這一想法,團隊構建了DeepSeek-OCR模型。從圖(a)的壓縮實驗中可以看出,視覺token數量和OCR解碼精度之間的權衡關系:


      64個視覺token(左側柱狀圖):當文本token數在600-700之間(壓縮率約10.5倍)時,精度為96.5%。隨著文本量增加到1200-1300(壓縮率接近20倍),精度下降到59.1%

      100個視覺token(右側柱狀圖):在600-700文本token(壓縮率6.7倍)時,精度高達98.5%。即使文本量增加,壓縮率達到12.6倍時,精度仍有87.1%

      這意味著,在10倍壓縮的范圍內,模型幾乎可以“無損”地從圖像中解碼出原文

      DeepSeek-OCR是如何實現的?

      DeepSeek-OCR的架構由兩部分組成:一個核心的編碼器DeepEncoder,和一個解碼器DeepSeek3B-MoE-A570M


      解碼器采用了高效的MoE(Mixture-of-Experts)架構,而整個系統的創新關鍵在于DeepEncoder

      為了在處理高分辨率圖像時,依然能保持較低的計算激活和可控的視覺token數量,DeepEncoder的架構設計非常巧妙,它串聯了三個關鍵組件:

      1.SAM-base (ViTDet):利用窗口注意力(window attention)機制處理局部感知,將輸入圖像(如1024x1024)分割成大量patch(如4096個)。由于是窗口注意力且模型規模不大(80M),激活值是可控的

      2.16倍卷積壓縮器:在特征進入全局注意力模塊前,通過一個2層卷積網絡進行16倍的下采樣,將視覺token數量從4096個銳減到256個

      3.CLIP-large (ViT):利用密集的全局注意力(dense global attention)機制提取視覺知識。由于輸入的token數量已經大幅減少,這里的計算開銷也變得可以接受

      這種“先局部處理,再壓縮,后全局理解”的串行設計,使得DeepEncoder能夠在處理高清圖像的同時,生成數量極少的視覺token,實現了內存和token的雙重壓縮

      效果炸裂,token用得還少

      在權威的文檔理解基準 OmniDocBench 上,DeepSeek-OCR展現了其卓越的實用性能。


      從上圖的性能對比中可以看出,DeepSeek-OCR(紅色圓點)在“平均每張圖的視覺token數”(橫軸)上處于最左側區域,意味著它使用的token數量最少。而在“整體性能(編輯距離)”(縱軸,越低越好)上,它卻達到了SOTA水平

      具體來看:

      僅用100個視覺token(Small模式),就超越了使用256個token的 GOT-OCR2.0

      使用不到800個視覺token(Gundam模式),性能就超過了需要 6000+ token的 MinerU2.0

      這充分證明,DeepSeek-OCR在實際應用中非常強大,并且由于其極高的token壓縮率,為未來的研究留下了更高的想象空間

      不止于OCR的“深度解析”

      除了常規的OCR能力,DeepSeek-OCR還具備對文檔內圖像進行深度解析的能力

      無論是金融研報里的圖表


      還是化學文獻里的分子式


      甚至是數學題中的幾何圖形,它都能進行結構化的解析和轉換


      此外,得益于其多語言的訓練數據,模型還能處理包括阿拉伯語、僧伽羅語在內的近百種語言的文檔

      未來構想:模擬人類記憶遺忘

      這項研究最引人遐想的部分,是它為實現LLM的記憶遺忘機制提供了一種可能的路徑

      研究人員將上下文光學壓縮與人類記憶的衰退過程進行了類比:


      近期記憶 (Recent Contexts):就像近處的物體,清晰可見。可以將其渲染成高分辨率圖像,用較多的視覺token來保留高保真信息

      遠期記憶 (Older Contexts):就像遠處的物體,逐漸模糊。可以將其漸進式地縮放成更小、更模糊的圖像,用更少的視覺token來表示,從而實現信息的自然遺忘和壓縮

      通過這種方式,模型可以在處理超長對話或文檔時,動態地為不同時期的上下文分配不同數量的計算資源,從而可能構建出一種理論上無限長上下文的架構。

      總而言之,DeepSeek-OCR不僅驗證了“上下文光學壓縮”這一新穎想法的可行性,還提供了一個性能強大、極具實用價值的開源模型,為解決LLM的長上下文難題開辟了一個全新的、充滿希望的方向。

      論文地址:

      http://github.com/deepseek-ai/DeepSeek-OCR

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      喜訊!澳超名帥剛要執教蓉城,就有望要求俱樂部跟這位外援續約

      喜訊!澳超名帥剛要執教蓉城,就有望要求俱樂部跟這位外援續約

      籃球看比賽
      2025-12-30 11:30:42
      銀行經理自縊后續:王某珊父母身份曝光,丈夫吃軟飯,倆娃成累贅

      銀行經理自縊后續:王某珊父母身份曝光,丈夫吃軟飯,倆娃成累贅

      葉公子
      2025-12-29 10:34:32
      “后悔來清華參觀,自取其辱”,母親帶娃游清華,被食堂氣到失控

      “后悔來清華參觀,自取其辱”,母親帶娃游清華,被食堂氣到失控

      詩意世界
      2025-11-30 11:04:47
      還你自由!曼聯通知桑喬不續約,三天后便可自由尋覓下家免費走人

      還你自由!曼聯通知桑喬不續約,三天后便可自由尋覓下家免費走人

      羅米的曼聯博客
      2025-12-29 11:55:41
      尹正:演日本人讓我覺得很惡心,因為我是中國人

      尹正:演日本人讓我覺得很惡心,因為我是中國人

      映射生活的身影
      2025-12-30 09:03:34
      三亞不香了?東北人撤離成潮,壓垮他們的不是物價,而是生活現實

      三亞不香了?東北人撤離成潮,壓垮他們的不是物價,而是生活現實

      歷史有些冷
      2025-12-04 20:20:06
      為什么找老公要找愛運動的?研究:爸爸的運動天賦,能通過精子傳給下一代

      為什么找老公要找愛運動的?研究:爸爸的運動天賦,能通過精子傳給下一代

      奇妙的本草
      2025-12-21 11:59:59
      一人洗碗全家得病?多虧醫生提醒:洗碗時,不能有的5個壞習慣

      一人洗碗全家得病?多虧醫生提醒:洗碗時,不能有的5個壞習慣

      妙招酷
      2025-11-28 23:43:06
      歷史開了個玩笑,先倒下的不是烏克蘭,而是百年中立的瑞士?

      歷史開了個玩笑,先倒下的不是烏克蘭,而是百年中立的瑞士?

      回京歷史夢
      2025-12-30 16:42:25
      她和奧運冠軍馬琳離婚分走千萬,再婚嫁給金融學霸,如今怎樣了?

      她和奧運冠軍馬琳離婚分走千萬,再婚嫁給金融學霸,如今怎樣了?

      優趣紀史記
      2025-12-28 14:47:11
      熱火狂轟22記三分球,掘金24分慘敗!約基奇傷退,穆雷空砍20+11

      熱火狂轟22記三分球,掘金24分慘敗!約基奇傷退,穆雷空砍20+11

      世界體育圈
      2025-12-30 11:20:32
      旅行團大媽路過我家芒果園,摘走27袋成熟的芒果,被抓后:這是撿秋

      旅行團大媽路過我家芒果園,摘走27袋成熟的芒果,被抓后:這是撿秋

      罪案洞察者
      2025-12-03 10:33:07
      里奇-保羅:自詹姆斯加盟湖人,我們從未掌控過湖人的運營

      里奇-保羅:自詹姆斯加盟湖人,我們從未掌控過湖人的運營

      懂球帝
      2025-12-30 09:11:38
      《康熙》嘉賓又走了一位!家人為錢反目,四個兄弟都拒絕認領遺體

      《康熙》嘉賓又走了一位!家人為錢反目,四個兄弟都拒絕認領遺體

      萌神木木
      2025-12-30 15:19:41
      攝影大賽一等獎作品疑似AI生成,6個文字無法辨識,檢測工具判定AI生成濃度近44%,主辦方:正在核查

      攝影大賽一等獎作品疑似AI生成,6個文字無法辨識,檢測工具判定AI生成濃度近44%,主辦方:正在核查

      每日經濟新聞
      2025-12-29 18:43:06
      2025年上海樓市總值大跌17萬億,入市每戶凈虧損113萬元

      2025年上海樓市總值大跌17萬億,入市每戶凈虧損113萬元

      道術意義
      2025-12-29 21:52:50
      TVB知名視帝為救患癌母親幾乎耗盡身家,母親吃一物每天要3000元

      TVB知名視帝為救患癌母親幾乎耗盡身家,母親吃一物每天要3000元

      小小李娛
      2025-12-30 11:26:55
      收藏保存!“正義使命-2025”演習高清大圖來了

      收藏保存!“正義使命-2025”演習高清大圖來了

      封面新聞
      2025-12-30 09:37:20
      肥腸再次成為關注對象!研究發現:常吃肥腸,身體會收獲3大好處

      肥腸再次成為關注對象!研究發現:常吃肥腸,身體會收獲3大好處

      全球軍事記
      2025-12-29 21:28:37
      泰柬沖突大勢已定,中方送給洪森父子四個字,阿努廷一戰定乾坤?

      泰柬沖突大勢已定,中方送給洪森父子四個字,阿努廷一戰定乾坤?

      史智文道
      2025-12-30 16:19:42
      2025-12-30 17:52:49
      AI寒武紀 incentive-icons
      AI寒武紀
      專注于人工智能,科技領域
      1024文章數 393關注度
      往期回顧 全部

      科技要聞

      估值150億的智元,開始批量"制造"小獨角獸

      頭條要聞

      臺軍承認:解放軍的五大演習區域都進入臺灣"12海里"

      頭條要聞

      臺軍承認:解放軍的五大演習區域都進入臺灣"12海里"

      體育要聞

      這個59歲的胖子,還在表演“蝎子擺尾”

      娛樂要聞

      林俊杰女友被扒 父親涉經濟案卷款13億?

      財經要聞

      朱光耀:美關稅政策正使WTO名存實亡

      汽車要聞

      標配華為乾崑ADS 4 Pro 華境S明年上半年上市

      態度原創

      家居
      手機
      親子
      健康
      軍事航空

      家居要聞

      當歸之宅 三胎圓滿居所

      手機要聞

      停車場的物理外掛?小米17 Ultra實測:隔著半條街也能掃?

      親子要聞

      國家統計局:2024年我國婦女健康水平持續提高,孕產婦死亡率再降5.3%

      這些新療法,讓化療不再那么痛苦

      軍事要聞

      福建海警艦艇與臺海巡船對峙航行

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 毛茸茸性xxxx毛茸茸毛茸茸| 暖暖 免费 高清 日本 在线观看5| 欧日韩无套内射变态| 亚洲色欲av| 亚洲丶国产丶欧美一区二区三区| 少妇爆乳无码专区| 国产人妖乱国产精品人妖| 日韩1级| 97久久人人超碰国产精品| 97av在线| 国产女人18毛片18精品| 性交大片| jizz日本版| 国产精品中文久久久久久久| 东京热A?V无码| 亚洲中文无码一区| 2018av天堂在线视频精品观看| 隔壁老王国产在线精品| www一区二区www免费| 蜜桃av一卡二卡三卡| 国内精品久久久久久中文字幕| 人妻少妇白浆| AV一区在线| 东北妇女精品bbwbbw| 亚洲AV无码久久精品色欲| 国产av一区二区三区| 我和亲妺妺乱的性视频| 日本熟妇浓毛| 丝袜美腿一区二区三区| 午夜亚洲www湿好爽| 又色又爽又黄18禁美女裸身无遮挡| 国产精品无码一区二区桃花视频| 日本无码白浆一区二区| 每日av| 欧美激情 亚洲 在线| 老司机精品影院一区二区三区| 亚洲嫩模一区二区三区| 一本大道久久香蕉成人网| 亚洲男人第一无码av网站| 久久精品国产曰本波多野结衣| 熟女熟妇伦av网站|