<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek 最新開源OCR模型,實測,不如百度

      0
      分享至

      大家好,我是 Ai 學習的老章


      DeepSeek-OCR

      DeepSeek 最近發布了《DeepSeek-OCR:基于視覺壓縮的大模型長上下文增強方案》這篇論文,同步開源了模型文件。

      最近一段時間好像是迎來了 OCR 的黃金時代,百度的 PaddleOCR-VL、阿里 Qwen3-VL、小紅書的 dots-ocr、Nanonets-OCR2 等等。

      更早之前我也測試過一些,閱讀不佳就沒再繼續

      論文上看,DeepSeek-OCR有兩個核心,一個是純粹的 OCR,這是本文測試的重點。


      另一個就是上下文光學壓縮(Contexts Optical Compression),解決了大模型在長上下文處理上的算力瓶頸。這玩意我是看不太懂,只看到市面上幾乎全部文章吹捧。

      DeepSeek-OCR 不僅是 OCR 模型,通過視覺壓縮實現“以小博大”,在長文本處理上突破了算力與精度的平衡,是大模型長上下文的一個解決方案,它讓 AI 的“記憶”更像人類,或許正在打開通往下一代智能的鑰匙。
      Andrej Jarpathy 也給予 DeepSeek-OCR 極高評價

      再回到 OCR 方面,DeepSeek-OCR 表現不俗

      • 壓縮比 ≤10 倍時,準確率 >95%,幾乎無損。

      • ICDAR 2023 數據集:10 倍壓縮下準確率 97.3%,速度 8.2 頁/秒,顯存僅 4.5GB。

      • 對比 MinerU2.0(6000+ tokens/頁,1.5 頁/秒,12.8GB 顯存),優勢明顯。

      • 財報:286 頁年報,表格還原率 95.7%,耗時 4 分鐘(

      • 論文:公式識別率 92.1%,LaTeX 可直接使用。

      • 合同:批注關聯率 89.5%,比 Tesseract 高 27%。

      DepSeek-OCR 實測--公式

      我沒有本地部署,直接使用了 HF 上一個 Space,應該是用的 Gradio 開發的


      https://huggingface.co/spaces/khang119966/DeepSeek-OCR-DEMO

      測試樣例取自我之前這篇文章:

      文中我測試幾個大模型(Kimi、Qwen-3-235B-A22B、Claude-3.7-sonnet、GPT-4.1、Gemini 2.5 Pro)在 latex 公式識別中的表現,測試從帶公式的圖片中識別出公式代碼,有兩個手寫公式識別,難度不小。當時 DeepSeek 不是多模態,沒有參與對比,本文剛好補上。

      例 1:中高難度,模糊手寫,數字是歐洲寫法,比如 7 中間加了一橫,其中有一個 8 寫的極像 6


      之前我測試只有 Gemini 2.5 Pro 可以完成任務,DeepSeek-OCR 犯了和其他模型一樣的問題,其中一個模糊的 8 識別成了 6。

      另外這個工具有一段奇怪的字符串

      刪掉之后就正常了,后面幾個,為了展示方便,我都刪了

      百度Paddle也沒完成,8識別成了6.

      例 2:簡單點,印刷版,可以完成任務,這個太簡單了,其他模型也都可以勝任


      例 3:上難度,多個復雜公式一次識別


      還行,有瑕疵,中間有奇怪符號,而且沒有換行

      百度完成的就很好


      例 4:復雜公式,帶矩陣運算

      DeepSeek-OCR 完成的不錯

      例 5:最高難度,模糊手寫,公式混在文本中,橫線與筆記本自帶的線混在一起


      這個只有 Gemini 2.5 Pro 成功識別的題目,DeepSeek- OCR 完成的很一般


      最后在看一個復雜表格識別

      DeepSeek- OCR 沒有把表頭識別好


      百度 paddle 就很 OK


      中間很多我沒有同時讓百度表現,因為也是用了 HF 的 Space,很不穩定


      總結看DeepSeek-OCR 確實很優秀,但是絕不是 SOTA 級別

      補充說明,不是 DeepSeek-OCR 不好,它有我無法理解的偉大創新。單 OCR 這一塊,單這幾個實例,它確實不如百度 PaddleOCR-VL 這個 0.9B 的小模型。

      此外,我還測試了一文中提到的 API,調用 DeepSeek-OCR 把 PDF 轉 Markdown。

      速度極快,22 頁,一分鐘不到。返回的是 json 格式,正文部分大量\n 預覽起來很費勁,簡單看,它沒有去理解配圖,其他都還行。


      制作不易,如果這篇文章覺得對你有用,可否點個關注。給我個三連擊:點贊、轉發和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      王惠在德云社職務發生變更

      王惠在德云社職務發生變更

      金融界
      2025-12-25 10:18:13
      被逼到墻角的克林頓宣戰了,哪怕身敗名裂,也要讓特朗普“陪葬”

      被逼到墻角的克林頓宣戰了,哪怕身敗名裂,也要讓特朗普“陪葬”

      墨蘭史書
      2025-12-24 20:30:03
      大合同!場均砍下19+11統治東部,年均4000萬啊,他才22歲,慕了

      大合同!場均砍下19+11統治東部,年均4000萬啊,他才22歲,慕了

      球童無忌
      2025-12-25 21:37:10
      又又又下課!丁偉生涯3次執教浙江男籃全下課 新賽季僅1勝4負

      又又又下課!丁偉生涯3次執教浙江男籃全下課 新賽季僅1勝4負

      醉臥浮生
      2025-12-25 11:05:02
      晚年張震將軍與家人的合影,百歲高齡得知兒子去世,63天后也逝世

      晚年張震將軍與家人的合影,百歲高齡得知兒子去世,63天后也逝世

      史之銘
      2025-12-24 19:29:38
      廣州小伙爬上4樓外墻與兩人攜手救下幼童!街坊:靚仔很棒

      廣州小伙爬上4樓外墻與兩人攜手救下幼童!街坊:靚仔很棒

      南方都市報
      2025-12-25 12:11:07
      外交部:堅決反對美方報告挑撥中國同其他國家關系

      外交部:堅決反對美方報告挑撥中國同其他國家關系

      新京報
      2025-12-25 15:48:03
      何晴閨蜜悼文爆料許何14歲搬許亞軍家真相 許何喪母后發消息給她

      何晴閨蜜悼文爆料許何14歲搬許亞軍家真相 許何喪母后發消息給她

      阿纂看事
      2025-12-25 09:53:45
      三花智控:最確定的10倍股?| 人形機器人(2)

      三花智控:最確定的10倍股?| 人形機器人(2)

      資本時差
      2025-12-25 18:19:54
      合租四年的女室友,突然要辭職回家相親,我打趣說:別走了嫁給我

      合租四年的女室友,突然要辭職回家相親,我打趣說:別走了嫁給我

      今天說故事
      2025-12-20 10:04:23
      臺灣省媒體人曝朱孝天猛料!他以前就很怪,是F4里可有可無的存在

      臺灣省媒體人曝朱孝天猛料!他以前就很怪,是F4里可有可無的存在

      小徐講八卦
      2025-12-25 12:52:21
      重磅官宣!山姆落戶黃埔,2028年開業!

      重磅官宣!山姆落戶黃埔,2028年開業!

      廣州樓市發布
      2025-12-25 18:40:40
      小區樓上天天晚上都有女的大聲叫。。。

      小區樓上天天晚上都有女的大聲叫。。。

      微微熱評
      2025-12-24 00:26:04
      阿森納魔鬼賽程到來!41天踢12場比賽+6戰強隊,4線爭冠或創紀錄

      阿森納魔鬼賽程到來!41天踢12場比賽+6戰強隊,4線爭冠或創紀錄

      體育知多少
      2025-12-25 10:26:21
      45歲董潔天安門騎行,穿1萬7羽絨服在大街吃肉串,86斤細腰藏大胃

      45歲董潔天安門騎行,穿1萬7羽絨服在大街吃肉串,86斤細腰藏大胃

      觀察鑒娛
      2025-12-25 08:46:47
      CBA教練變動:山東主帥下課,剩余教練面臨挑戰

      CBA教練變動:山東主帥下課,剩余教練面臨挑戰

      工從昊懂球阿靖
      2025-12-25 11:34:06
      又一款10050mAh新機官宣:12月25日,全新上市!

      又一款10050mAh新機官宣:12月25日,全新上市!

      科技堡壘
      2025-12-23 11:46:19
      我國4大光瓶酒,100%純糧釀,品質好價格實,月薪3000也能喝

      我國4大光瓶酒,100%純糧釀,品質好價格實,月薪3000也能喝

      濤哥美食匯
      2025-12-23 14:31:30
      中美在聯合國交鋒,中方呼吁撤軍,美方拒絕接受,俄羅斯挺身而出

      中美在聯合國交鋒,中方呼吁撤軍,美方拒絕接受,俄羅斯挺身而出

      臨云史策
      2025-12-25 21:36:39
      三個信號表明,美準備打大仗,六國已被鎖定,卻避開了中國這條線

      三個信號表明,美準備打大仗,六國已被鎖定,卻避開了中國這條線

      梁訊
      2025-12-25 10:36:48
      2025-12-25 22:31:02
      機器學習與Python社區 incentive-icons
      機器學習與Python社區
      機器學習算法與Python
      3234文章數 11081關注度
      往期回顧 全部

      科技要聞

      小米17Ultra發布,徠卡2億像素 ,6999元起

      頭條要聞

      韓國"最毒"財閥千金被捕 韓國人稱"經過她身邊就會死"

      頭條要聞

      韓國"最毒"財閥千金被捕 韓國人稱"經過她身邊就會死"

      體育要聞

      單賽季11冠,羽壇“安洗瑩時代”真的來了

      娛樂要聞

      朱孝天把阿信好意當球踢!

      財經要聞

      時隔15月,人民幣升破7,三大推手曝光

      汽車要聞

      速來!智界在上海西岸準備了年末潮流盛典

      態度原創

      本地
      親子
      手機
      數碼
      公開課

      本地新聞

      這輩子要積多少德,下輩子才能投胎到德國當狗

      親子要聞

      冬季是孩子補營養的關鍵期,超值福利就在直播間

      手機要聞

      realme真我手機回應“大規模裁員”:系年底正常的人員變動

      數碼要聞

      小米Buds 6耳機發布 支持智能錄音翻譯功能 售價699元

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 屁屁影院国产第一页| 亚洲18禁| 7777精品伊人久久久大香线蕉全新功能| 久久国产精品夜色| 欧美性插b在线视频网站| 国产色资源| 国产99久久亚洲综合精品西瓜tv| 国产VA在线视频观看| 精品国模| 中国内地毛片免费高清| 欧美色欧美亚洲高清在线视频 | 国产精品久久久久久久久齐齐| 99久久久精品免费观看国产| 噜妇插内射精品| 国产人妖乱国产精品人妖| 91碰碰| 无码人妻一区二区三区免费n鬼沢| 久草成人网| 亚洲久悠悠色悠在线播放| 日本熟妇色xxxxx欧美老妇| 亚洲国产一线二线三线| 中文无码日韩欧免费视频| 久久精品国产77777蜜臀| 国产精品理论片| 国内精品久久久久影院优| 大竹县| 久久伊伊| 日本特黄特色aaa大片免费| 天天艹天天干| 国产私拍大尺度在线视频| 亚洲精品www久久久久久| 国产麻豆精品手机在线观看| AV色色色| 天堂在线中文网www| 婷婷综合视频| 欧美日韩精品一区二区三区钱| 最新99热| 91视频免费看| 无码国产乱人伦偷精品视频| 无码 人妻 在线 视频| 精品玖玖|