<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      DeepSeek新論文被稱“硅基生命進化論”,海量文字壓縮成圖,模仿人腦重塑AI視覺記憶邊界,贏硅谷大佬力挺

      0
      分享至



      出品|搜狐科技

      作者|鄭松毅

      DeepSeek再次“低調”震驚世界!

      他們新發(fā)布并開源的OCR模型,從根本上改變了AI游戲規(guī)則。Github開源項目DeepSeek-OCR,一夜收獲超4k星。相關論文(《DeepSeek OCR:上下文光學壓縮》)解釋了這一研究成果。

      很多人好奇,什么是OCR?

      傳統(tǒng)OCR如同“文字掃描儀”,通過光學技術將圖像中的文字提取轉換為計算機和人都能理解的格式。比如,在將大量票據(jù)、證件、表單等數(shù)據(jù)電子化時,OCR發(fā)揮關鍵作用。

      但DeepSeek卻反其道而行之——將文本信息“繪制”為視覺圖像,再通過視覺模型實現(xiàn)高效理解。如此創(chuàng)新嘗試就是為了解決大模型的核心痛點——處理長文本時面臨的計算挑戰(zhàn)。

      效果有多驚艷?10頁密密麻麻的文本報告,被壓縮成一張圖片,AI能夠一眼讀懂它。這樣的信息處理效率意味著大幅降低了計算復雜度,用最直接的方式節(jié)約成本。

      論文發(fā)布后,意料之內的好評如潮,有網(wǎng)友直接將其稱為“硅基生命進化論”。

      最近還在銳評AI發(fā)展的OpenAI創(chuàng)始團隊成員、特斯拉前AI總監(jiān)Karpathy,對DeepSeek新成果直言喜愛,并指出“早就該讓視覺成為AI核心,而非依賴爛透了的文本分詞器。”

      更有業(yè)內大佬感嘆,“當文本能被轉化為視覺可理解的結構,語言與視覺的統(tǒng)一或許不再是理論。這可能是通往 AGI(通用人工智能)的關鍵一步。”


      DeepSeek新研究:

      把大量文字壓縮到圖片,讓模型直接看圖理解

      本質上來說,DeepSeek-OCR是將視覺與語言模態(tài)深度融合,通過“視覺-文本壓縮”建立自然映射關系,為多模態(tài)大模型提供了新的技術路徑。

      之前的大模型可以說是“帶著腳銬的舞者”,雖有強大的語言理解能力,卻被低效的信息輸入方式嚴重束縛。

      拿模型閱讀長篇文本來說,每頁財報、論文都包含數(shù)千個token,傳統(tǒng)方式下只能逐字逐句識別,導致計算量爆炸。這種低效作業(yè)讓大模型在法律、金融等領域的應用舉步維艱。

      而DeepSeek這次用到了一個巧妙思維——既然一張圖片能裝下成千上萬的文字,那是不是大量文字信息也能被壓縮到一張圖片里,讓模型直接看圖理解就好了。

      為實現(xiàn)這一設想,DeepSeek為OCR模型配備了三件套——圖像編碼器、映射層和文本解碼器。其中,圖像編碼器DeepEncoder(負責把圖片轉成高度壓縮的視覺token)參數(shù)為380M,文本解碼器(負責從壓縮的視覺token里重建文字)是一個deepseekv2-3b的模型,參數(shù)為3B。

      整體訓練數(shù)據(jù)由4部分組成,包括OCR1.0數(shù)據(jù)(傳統(tǒng)OCR任務,如圖像OCR和文檔OCR)、OCR2.0數(shù)據(jù)(復雜圖像解析任務,如幾何、圖表等)、通用視覺數(shù)據(jù)(用于注入通用圖像理解能力)、及純文本數(shù)據(jù)(用于確保模型的語言能力)。

      別看模型參數(shù)不大,但就研究結果發(fā)現(xiàn),當文本壓縮率小于10倍時,模型OCR解碼準確率高達97%,及時壓縮率高達20倍時,準確率依舊能保持在60%。在A100-40G顯卡環(huán)境下,單日可生成超過20萬頁的模型訓練數(shù)據(jù)。

      也就是說,如果普通 OCR 需要 10,000 個 token 才能讀完整篇文檔,這個模型可能只用 1,000 個就能搞定,且能高準確度地理解信息。

      受益于訓練數(shù)據(jù)多樣性,論文提到DeepSeek-OCR不僅能識別文字,還能理解文檔布局、圖表結構。從某種角度說,這已經(jīng)不是傳統(tǒng)的OCR,而更接近“文檔理解引擎”。

      論文中提到的一個基準叫OmniDocBench,就是專門用來測試復雜文檔理解能力的。DeepSeek-OCR 在這個基準上,用更少的視覺 token 數(shù)量就超過了 GOT-OCR 2.0 和 MinerU 2.0,這倆都是目前較頂尖的開源 OCR 模型,可謂十分能打。



      讓AI記憶模式更像人類

      在論文中,DeepSeek還談到了一直困擾業(yè)界的AI“記憶”和“遺忘”機制。

      深度學習模型的記憶以分布式參數(shù)形式存儲,這種非結構化存儲導致傳統(tǒng)神經(jīng)網(wǎng)絡在學習新任務時,舊知識的參數(shù)空間會被新知識覆蓋,模型無法做到像人類一樣進行連貫推理。

      而DeepSeek的想法是,通過視覺-文本壓縮范式和動態(tài)分層遺忘機制,讓AI“記住該記住的,忘記該忘記的”。

      其核心思路是將文本信息轉化為視覺token,通過光學壓縮實現(xiàn)高效記憶管理,同時模擬人類遺忘曲線動態(tài)調整信息留存。


      在這個過程中,核心組件DeepEncoder發(fā)揮關鍵作用,50-100個視覺tokens即可還原1000字文本,實現(xiàn)近 10 倍的計算量節(jié)省。

      這種壓縮并非簡單的信息降維,而是通過“注意力機制+結構化訓練”,優(yōu)先保留對模型推理最關鍵的信息。類似人類閱讀時“先抓標題再看細節(jié)”的認知模式,去除不重要的信息噪聲。

      關于如何讓模型的記憶模式更像人類,研究者做了進一步解釋:對于近期記憶,可以將其渲染成高分辨率圖像,用多token數(shù)量保留高保真信息。而對于遠期記憶,可以縮放成更小、更模糊的圖像,用少量token來保留信息,從而實現(xiàn)信息的自然遺忘和壓縮。

      雖然當前還僅是研究前期探索階段,但DeepSeek的創(chuàng)新思路,確實讓AI越來越像人類了。


      三名作者

      本篇論文共有3名作者:Haoran Wei、Yaofeng Sun、Yukun Li。

      論文一作Haoran Wei曾主導開發(fā)爆火項目GOT-OCR2.0,此次的DeepSeek-OCR也可以說是延續(xù)了此前項目的創(chuàng)新技術路徑。根據(jù)此前論文信息顯示,Haoran Wei還曾就職于階躍星辰。


      Yaofeng Sun畢業(yè)于北京大學圖靈班計算機科學專業(yè),于2023年加入DeepSeek,先后參與DeepSeek-r1、DeepSeek-v3、DeepSeek-v2等模型的研究。


      Yukun Li也參與了包括DeepSeek-v2/v3在內的多款模型研究,谷歌學術論文引用量近萬。




      運營編輯 |曹倩審核|孟莎莎




      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      可以「追殺」徐鶯,誰敢奈何「康生」?

      可以「追殺」徐鶯,誰敢奈何「康生」?

      家傳編輯部
      2025-12-28 09:37:04
      最新后續(xù),閆學晶終于回應:態(tài)度令人意外,這回里子面子全都沒了

      最新后續(xù),閆學晶終于回應:態(tài)度令人意外,這回里子面子全都沒了

      好賢觀史記
      2025-12-30 22:14:23
      花費1億請趙本山代言,成本2毛騙農戶200億,創(chuàng)始人被判無期徒刑

      花費1億請趙本山代言,成本2毛騙農戶200億,創(chuàng)始人被判無期徒刑

      法老不說教
      2025-12-17 20:08:06
      回顧探花大神:害人害己,多位女主被親戚認出當場“社死”

      回顧探花大神:害人害己,多位女主被親戚認出當場“社死”

      就一點
      2025-10-09 12:19:42
      泳壇女神劉湘近照,轉型網(wǎng)紅越來越美,身材火辣,29歲不愁工作

      泳壇女神劉湘近照,轉型網(wǎng)紅越來越美,身材火辣,29歲不愁工作

      大西體育
      2025-12-31 10:13:38
      中國工程院院士姜保國到重醫(yī)大附三院(方大醫(yī)院)開展醫(yī)療指導與學術交流

      中國工程院院士姜保國到重醫(yī)大附三院(方大醫(yī)院)開展醫(yī)療指導與學術交流

      金臺資訊
      2025-12-31 11:51:10
      美女老板刪光視頻拒送車!網(wǎng)友:她家傷天害理 因工致殘只賠我4萬

      美女老板刪光視頻拒送車!網(wǎng)友:她家傷天害理 因工致殘只賠我4萬

      念洲
      2025-12-30 21:46:06
      統(tǒng)一刻不容緩!特朗普幫了中國大忙,中國錯失機會要再等10年

      統(tǒng)一刻不容緩!特朗普幫了中國大忙,中國錯失機會要再等10年

      潮鹿逐夢
      2025-12-21 10:58:57
      5分領跑積分榜!阿森納4-1終結維拉11連勝,熱蘇斯復出首球

      5分領跑積分榜!阿森納4-1終結維拉11連勝,熱蘇斯復出首球

      全景體育V
      2025-12-31 06:26:17
      熱點城市聚焦:重磅!上海落戶,風向要變了!

      熱點城市聚焦:重磅!上海落戶,風向要變了!

      說故事的阿襲
      2025-12-31 09:51:46
      8連勝!8連敗!CBA瘋狂一夜:全勝剩1隊 廣廈助攻廣東 附最新排名

      8連勝!8連敗!CBA瘋狂一夜:全勝剩1隊 廣廈助攻廣東 附最新排名

      侃球熊弟
      2025-12-30 22:04:26
      廣東男籃8連勝領跑,賽后5大利好曝光,下輪對陣北京隊勝算鎖定!

      廣東男籃8連勝領跑,賽后5大利好曝光,下輪對陣北京隊勝算鎖定!

      小鬼頭體育
      2025-12-31 15:33:09
      外甥似舅:12歲喬治王子逐漸顯露斯賓塞家族基因,很像戴安娜弟弟

      外甥似舅:12歲喬治王子逐漸顯露斯賓塞家族基因,很像戴安娜弟弟

      毒舌小紅帽
      2025-12-30 19:16:38
      被丈夫與閨蜜雙重背叛的“場子姐”勝訴,第三者返還4萬余元

      被丈夫與閨蜜雙重背叛的“場子姐”勝訴,第三者返還4萬余元

      大象新聞
      2025-12-31 12:45:12
      法國沒有參與火燒圓明園?英國人說出放火真正目的:讓中國記住

      法國沒有參與火燒圓明園?英國人說出放火真正目的:讓中國記住

      史之銘
      2025-12-11 16:37:42
      朝鮮正面臨一個重大危機!最致命的危機實則不是炮火,而是糧食!

      朝鮮正面臨一個重大危機!最致命的危機實則不是炮火,而是糧食!

      扶蘇聊歷史
      2025-12-31 10:56:37
      讓人倒吸一口涼氣:烏軍3個旅反攻俄軍2個軍:24小時竟打進市中心

      讓人倒吸一口涼氣:烏軍3個旅反攻俄軍2個軍:24小時竟打進市中心

      瞳哥視界
      2025-12-24 21:36:08
      收復臺灣后,中國還有三大領土必須收復!分別是哪三大?

      收復臺灣后,中國還有三大領土必須收復!分別是哪三大?

      老臉科普君
      2025-12-19 10:16:33
      蔡依林太會玩兒了!演唱會上“踩蛇出場”!視覺震撼像極了美杜莎

      蔡依林太會玩兒了!演唱會上“踩蛇出場”!視覺震撼像極了美杜莎

      明星私服穿搭daily
      2025-12-31 07:19:45
      曹薰鉉兩項世界紀錄被打破,申真谞的接班人出現(xiàn)了?

      曹薰鉉兩項世界紀錄被打破,申真谞的接班人出現(xiàn)了?

      月滿大江流
      2025-12-31 11:43:33
      2025-12-31 17:32:49
      搜狐科技 incentive-icons
      搜狐科技
      搜狐科技官方賬號
      4627文章數(shù) 9175關注度
      往期回顧 全部

      科技要聞

      老羅,演砸了,也封神了?

      頭條要聞

      美國防部稱中國大陸對臺有"四種軍事方案" 國臺辦回應

      頭條要聞

      美國防部稱中國大陸對臺有"四種軍事方案" 國臺辦回應

      體育要聞

      2025全球射手榜:姆巴佩66球 梅西第6C羅第9

      娛樂要聞

      告別2025年!大S、方大同離世青春退場

      財經(jīng)要聞

      高培勇:分配制度改革是提振消費的抓手

      汽車要聞

      凱迪拉克純電中型SUV 售價不足24萬/33寸曲面屏

      態(tài)度原創(chuàng)

      藝術
      時尚
      游戲
      教育
      公開課

      藝術要聞

      中國博物館全書!看遍中國8000年頂流審美

      今年冬天流行的“倒三角”穿法,時髦又高級!

      小高和剛:100個結局太少!想做個《兩百日戰(zhàn)紀》

      教育要聞

      像喜歡年初一樣,喜歡年末 | 2025山東教育的溫暖答卷

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 中日韩在线| 欧美丰满老妇性猛交| 欧洲熟妇色xxxx欧美老妇软件| 久久久久国产a免费观看rela| 日韩av在线不卡一区二区三区 | 中文字幕乱码中文字幕| 中文字幕有码在线观看| 狠狠亚洲欧美日韩| 色噜噜狠狠色综合成人网| 国产性色av高清在线观看| 天堂а√8在线最新版在线| 国产精品理论片| 亚洲中文久久久精品无码| 日韩AV在线免费观看| 古田县| 玩弄人妻少妇500系列| 扒开双腿被两个男人玩弄视频| 亚洲av日韩av永久无码电影| 成人亚洲精品一区二区三区嫩花| 国产人妻精品一区二区三区不卡| 无码人妻精品丰满熟妇区| 男女做爱网站| 国产粗大| 九一九色国产| 欧美p| 久久精品无码精品免费专区| 亚洲欧美在线观看| 天美传媒mv免费观看完整| 樱花飘落视频素材| 中文字幕欧美人妻精品| 裸身美女无遮挡永久免费视频| 亚洲日韩电影久久| 亚洲最大福利视频网| 51国产在线| 在线观看国产午夜福利片| 国产99久久久国产精品~~牛| 午夜精品久久久久久久爽| 蜜桃视频在线观看18| 武义县| 欧美午夜精品久久久久久浪潮 | 成人影片一区免费观看|