剛剛，DeepSeek 上新，V4 的模樣更清晰了

2026-01-27 14:02:03　來源: AppSo

廣東舉報

分享至

臨近春節(jié)，DeepSeek 又有新動作了。

就在剛剛，DeepSeek 在 HuggingFace 和 GitHub 上開源新模型OCR 2，并附上了完整的論文。

和初代 OCR 主打視覺壓縮不同，這是一種旨在改進(jìn)視覺-語言模型（VLMs）中視覺編碼方式的新型模型。核心創(chuàng)新在于引入了 DeepEncoder V2，通過模擬人類的視覺因果推理能力，解決了傳統(tǒng)模型在處理復(fù)雜文檔布局時的局限性。

傳統(tǒng)的 VLMs 通常按固定的光柵掃描順序（從左上到右下）處理圖像，這種僵化的方式不符合我們的視覺感知，人類是基于內(nèi)容的靈活掃描，而且在處理復(fù)雜布局，如表格、公式、多欄文本時會引入錯誤的信息。

而 OCR 2，就是利用新型編碼器 DeepEncoder V2，給了模型「視覺因果流 Visual Causal Flow」的能力，讓模型能夠根據(jù)圖像內(nèi)容，動態(tài)地重新排序視覺 Token。

DeepEncoder V2 是 OCR 2 模型的關(guān)鍵創(chuàng)新，它的設(shè)計有以下幾個特點(diǎn)。

1?? 拋棄了上一代 DeepEncoder 中使用的 CLIP 模塊，轉(zhuǎn)而使用一個緊湊的 LLM 架構(gòu)（基于 Qwen2-0.5B）作為視覺編碼器。

2?? 混合注意力機(jī)制，視覺 Token 上使用雙向注意力，類似于 ViT。在因果流查詢，引入可學(xué)習(xí)的查詢 Token，能夠關(guān)注到所有視覺 Token 和之前的查詢，從而實(shí)現(xiàn)對視覺信息的邏輯重排序。

3?? 級聯(lián)因果推理，這種設(shè)計形成了一個兩級級聯(lián)結(jié)構(gòu)，編碼器通過查詢 Token 對視覺信息進(jìn)行語義重排序，隨后的 LLM 解碼器則基于這個有序序列進(jìn)行推理。

4?? Token 壓縮，輸入給 LLM 的視覺 Token 數(shù)量控制在 256 到 1120 之間。這個數(shù)量級既保留了 OCR 的高壓縮比，又做到了 Gemini 3 Pro 的最大視覺 Token 預(yù)算能做的事。

基于全新的架構(gòu)設(shè)計和訓(xùn)練，DeepSeek-OCR 2 在多個指標(biāo)上展現(xiàn)了顯著提升。

1?? 基準(zhǔn)測試，在 OmniDocBench v1.5 上，DeepSeek-OCR 2 的整體性能達(dá)到 91.09%，相比初代基線提升了 3.73%。

2?? 閱讀順序，編輯距離從 0.085 顯著降低至 0.057，證明了模型在理解視覺邏輯順序方面的進(jìn)步。

3?? 生產(chǎn)環(huán)境表現(xiàn)，在實(shí)際應(yīng)用中，重復(fù)率大幅下降，例如在線用戶日志數(shù)據(jù)中從 6.25% 降至 4.17%，表明模型的實(shí)用性和穩(wěn)定性更強(qiáng)。

4?? 效率，在保持高性能的同時，使用了極低的視覺 Token 預(yù)算，最多 1120 個，相比其他模型效率更高。

未來，DeepSeek 打算通過兩個 1D 因果推理器的級聯(lián)，探索實(shí)現(xiàn)真正的 2D 圖像理解和推理。

論文：https://github.com/deepseek-ai/DeepSeek-OCR-2

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點(diǎn)推薦

莫斯科空域遭侵襲多位中國游客滯留

極目新聞 2026-02-23 12:06:50
48308 跟貼 48308
獨(dú)家｜近20天收入超去年全年！月之暗面成國內(nèi)最快晉級十角獸公司

澎湃新聞 2026-02-23 16:24:27
365 跟貼 365

趙心童奪得斯諾克球員錦標(biāo)賽冠軍，蘇格蘭名將希金斯：他“絕對是個天才”

環(huán)球網(wǎng)資訊 2026-02-23 15:25:19
737 跟貼 737

攝影界來了個“天才”！江蘇一網(wǎng)友把老虎拍得比山大，細(xì)看發(fā)現(xiàn)是“近大遠(yuǎn)小” 的視覺錯位，網(wǎng)友：刷到你之前我簡直在亂拍

極目新聞 2026-02-23 16:30:17
890 跟貼 890
越南"特斯拉"瘋狂占領(lǐng)本土市場背后是中國公司在供貨

財聯(lián)社 2026-02-23 10:29:19
1417 跟貼 1417

美貿(mào)易代表威脅：和中歐日韓的協(xié)議依然算數(shù) 都得履行

澎湃新聞 2026-02-23 22:58:16
93 跟貼 93

1188元買套餐 36斤活羊烤完只剩6.9斤顧客吐槽羊腿大小酷似鴨腿商家回應(yīng)稱屬正常現(xiàn)象

閃電新聞 2026-02-23 17:40:28
407 跟貼 407
300多只東北虎“輕斷食”？景區(qū)：每天斷食1個園，司機(jī)會帶游客找可投喂區(qū)

封面新聞 2026-02-23 16:29:03
1029 跟貼 1029

莆田廣播電視臺通報游客采訪口音受質(zhì)疑

極目新聞 2026-02-23 17:05:14
47 跟貼 47
中國最大收費(fèi)站出口全開迎返程高峰

河南新聞廣播 2026-02-23 11:39:16
9000 跟貼 9000
中辦印發(fā)《通知》在全黨開展樹立和踐行正確政績觀學(xué)習(xí)教育

澎湃新聞 2026-02-23 20:28:07
75 跟貼 75
俄羅斯索契機(jī)場暫停所有航班運(yùn)營

央視新聞客戶端 2026-02-23 15:48:36
5507 跟貼 5507
大漲！有的價格翻10倍，根本搶不到！很多人開始翻出家里老古董

極目新聞 2026-02-23 19:39:41
69 跟貼 69
哈爾濱冰雪大世界：正式閉園

大風(fēng)新聞 2026-02-21 20:36:03
1869 跟貼 1869
日本經(jīng)濟(jì)長期疲軟，日元購買力跌至53年來最低

環(huán)球網(wǎng)資訊 2026-02-24 06:44:00
5 跟貼 5
詹姆斯：想不明白布朗為何沒進(jìn)入MVP討論

北青網(wǎng)-北京青年報 2026-02-23 19:34:02
156 跟貼 156
華強(qiáng)北“科技年貨”爆火，AI眼鏡銷量大增80%，200元能入手基礎(chǔ)款

紅星資本局 2026-02-23 19:07:04
103 跟貼 103
美官員稱美國下令撤離駐黎巴嫩大使館人員

央視新聞客戶端 2026-02-23 22:36:18
713 跟貼 713
烏官員：與俄新一輪談判或于2月26日至27日舉行

央視新聞客戶端 2026-02-23 21:25:10
445 跟貼 445
加價加瘋了！職業(yè)順風(fēng)車司機(jī)要價3000元，乘客不慣著，直接投訴封號7天

網(wǎng)約車觀察室 2026-02-24 09:52:47
0 跟貼 0
身體不適！曝波爾津吉斯將至少缺席勇士客場背靠背的兩場比賽

北青網(wǎng)-北京青年報 2026-02-24 09:36:04
0 跟貼 0
溫州某商場一豪車被撞！這個人要出名

住溫網(wǎng) 2026-02-24 09:47:29
0 跟貼 0
美股三大指數(shù)收盤均跌超1% IBM創(chuàng)2000年以來最大跌幅

每日經(jīng)濟(jì)新聞 2026-02-24 07:22:53
0 跟貼 0
夫妻爭吵，男子抱起一個孩子扔河里，夫妻倆隨即跳河，另一孩子哭得撕心裂肺

上觀新聞 2026-02-24 09:59:13
0 跟貼 0
春節(jié)高速免費(fèi)最后1分鐘：有人壓哨通過省下1000多元，也有車主從蕭山上高速后“卡點(diǎn)”失敗交了幾百元通行費(fèi)

都市快報橙柿互動 2026-02-24 09:16:26
0 跟貼 0

為什么家里盡量不要裝監(jiān)控？網(wǎng)友的評論令人細(xì)思極恐

柏銘銳談

2026-02-23 07:56:14

堵車卷到極致！廣東返程路上的“堵神”們，你們還好嗎？

芭比衣櫥

2026-02-23 19:40:36

手機(jī) / 數(shù)碼

房產(chǎn) / 家居

剛剛，DeepSeek 上新，V4 的模樣更清晰了

AI顛覆發(fā)展最新犧牲品！IBM跳水重挫超13%

牛彈琴：白宮突然發(fā)了張圖 傷害性不大侮辱性極強(qiáng)

牛彈琴：白宮突然發(fā)了張圖 傷害性不大侮辱性極強(qiáng)

蘇翊鳴總結(jié)米蘭征程：我仍是那個熱愛單板滑雪的少年

那藝娜賬號被禁止關(guān)注，視頻已清空！

美擬以國家安全為由推出新關(guān)稅

續(xù)航1810km！smart精靈#6 EHD超級電混2026年上市

態(tài)度原創(chuàng)

晨報|未來暗黑將加速推新 棒雞警告《馬拉松》作弊者

轉(zhuǎn)頭就暈的耳石癥，能開車上班嗎？

文字素描課 | 優(yōu)秀作文：一雙手，暖了新春

今年春天一定要擁有的針織，這樣穿減齡又好看！

美軍重兵集結(jié)蓄力作戰(zhàn)之際 新一輪美伊談判時間“敲定”

牛彈琴：白宮突然發(fā)了張圖傷害性不大侮辱性極強(qiáng)

牛彈琴：白宮突然發(fā)了張圖傷害性不大侮辱性極強(qiáng)

晨報|未來暗黑將加速推新棒雞警告《馬拉松》作弊者

美軍重兵集結(jié)蓄力作戰(zhàn)之際新一輪美伊談判時間“敲定”