<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek開源的新東西到底強在哪?我幫你找專家問了問

      0
      分享至



      本周,DeepSeek 新開源的 DeepSeek-OCR 在開源社區的熱度持續發酵。

      人們興奮的點是:它不僅是一款新的光學字符識別模型,還更像是一次對 “ 大模型記憶機制 ” 的重新設計。

      在 DeepSeek-OCR 的架構中,圖像不再只是文字的載體,而是成為一種語義壓縮的中間語言。文字被渲染成圖像后,經由 DeepEncoder 轉換為緊湊的視覺表征;這些視覺 token 既可以通過 DeepSeek 3B-MoE 模型還原為原始文本(這也是標準的 OCR 機制),也可以與其他輸入 token 與 prompt 結合,執行問答、摘要、檢索等復雜任務。

      通俗來說,就是我們可以把大量文字打包壓縮成一張圖片來節省空間,等需要使用的時候再解壓出來,甚至在一部分使用場景中,你甚至不需要解壓,直接用壓縮包就可以達成目的。



      DeepSeek-OCR 模型架構。圖源:
      https://github.com/deepseek-ai/DeepSeek-OCR/blob/main/DeepSeek_OCR_paper.pdf

      即便在 10× 壓縮比的條件下,模型的文本還原精度仍可達 97%。隨著大模型逐漸向越來越復雜的場景嵌入,上下文長度資源遠不夠用甚至越來越不夠用,而基座模型在此參數上升級頗為緩慢的當下,DeepSeek-OCR 的發布瞬間帶來很大的想象空間。

      研究團隊甚至還進一步提出 “ 遺忘機制 ” 的構想,模型可依據信息的 “ 時序遠近 ”,在視覺壓縮階段主動衰減細節,從而實現一種類人記憶式的上下文管理。

      那么,視覺 token 為何能在信息量不損失太多的情況下,比文本 token 少一個數量級?模型記憶能否完全用視覺邏輯來替代?DeepSeek-OCR 是否為解決大模型上下文長度受限的問題提供了一條現實可行的途徑?DeepSeek-OCR 反映了多模態大模型的什么發展趨勢?

      帶著這些問題,知危與 Sand.ai 聯合創始人、首席科學家、《 Swin Transformer 》作者張拯進行了簡單的對話。

      知危:

      同一段輸入,為什么視覺 token 可以比文本 token 的數量少得多,有沒有直觀或本質的解釋?

      張拯:

      有兩種觀點。第一種,視覺是一個 2D 表達,因此可以比 1D 的表達更高效。

      第二種,高效的原因不是視覺 v.s. 文本,而是兩邊采用的 token 表達方式不同:做視覺表達的時候,我們是在一個高維的連續空間中做信息壓縮( 把 image patch 映射為一個高維特征 ),之前 LLM 里常用的 tokenizer( 把文本數據向量化的工具,通俗理解是一種把自然語言翻譯為機器能理解的語言的工具 )則實際上可以被認為是在一個一維空間中做壓縮( 把文本映射為 id )。高維連續空間本來就有更好的表達能力,因此可以用更少的 token 數量來表達更多信息。其實文本也可以做成連續表達,來大幅度減少文本 token,但是目前應該沒有被很廣泛地用到 LLM 里。

      這兩種觀點,我 buy-in 第二種。

      知危:

      DeepSeek-OCR 相比過往的 OCR 模型,除了效率提升方面,還有哪些獨創性?

      張拯:

      我最近沒有特別研究過 OCR 模型的進展,但基于我看過的一些信息,我覺得 DeepSeek-OCR 的技術本身好像并沒有非常特別的部分。但是在觀點上,“ 把視覺作為文本長上下文的壓縮介質 ”,這個 idea 還是很棒的。這個 idea 有路線上的啟發意義,相較于現在的多模態模型,DeepSeek-OCR 會使用兩種不同的 tokenizer 機制,這種路線也許會啟發更好的多模態模型設計方案。

      知危:

      這項技術對于基礎模型上下文長度難以擴展的當下,可以帶來多大的成本效益?對上下文工程的優化有哪些好處?

      張拯:

      理論上最多能拿到 N^2 倍的收益,N 是 Vision Token 相較于 Text Token 的壓縮率。對于上下文工程的優化,最大的好處應該就是不用那么仔細地管理上下文長度了。

      知危:

      DeepSeek 設想的遺忘機制是否過于簡化?忽略了語義的重要性排序?

      張拯:

      這種設想肯定還是很初步的,但是也能腦洞出很多改進的空間,比如語義重要的部分可以渲染成更大的字體?

      知危:

      Andrej Karpathy 認為視覺 token 有潛力可以完全替代文本 token,因為信息壓縮、多模態、可雙向注意力處理、無需 tokenizer 等優勢,您怎么看?

      張拯:

      大部分都同意,但是 “ 可雙向注意力處理 ” 這里有待探討,“ 可雙向注意力處理 ” 很大程度上和 training objective( 訓練目標 )有關。

      另外,如果后面都是處理視覺 token 了,是不是有機會讓模型能在一個 2D 的空間里做思考?從而帶來更高效的推理( 類似 GPT-4o 的 thinking with image )?這個我覺得還是挺有意思的。

      知危:近期 Meta 也提出了一個無需 tokenizer 的模型架構 Byte Latent Transformer ,可以跳過 tokenization ,直接學習原始字節流。結合以上討論和領域現狀,您認為這體現了多模態大模型的哪些發展趨勢?

      張拯:

      宏觀一點來看,不同模態模型的范式還是有機會持續進化的。

      更細節一點的話,我初步想到的有兩個:

      • 現在的多模態大模型的主流做法基本上可以認為在捏合各種不同的模態的模塊,整個訓練 pipeline 其實還是有點復雜( 不優雅 )的。大家肯定希望有更簡單、更統一的方式來處理。類似 DeepSeek-OCR 這樣的工作對我們開發更好的多模態模型范式還是挺有啟發的。
      • 離散表達和連續表達之間的關系,以及是否有更好的組合方式,可能也挺重要的。

      ( 對話全文完 )

      總體來看,DeepSeek-OCR 更多是基于效率上的大幅提升啟發了一個新的路線。

      當模型的 “ 思考空間 ” 從一維文本拓展至二維視覺,思考和推理也可能變得更加高效和簡潔。而在技術層面,則指向當前多模態大模型領域正等待一把 “ 奧卡姆剃刀 ” 簡化模型范式的時刻。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      重慶美女美玲客死廣東,僅38歲,長期熬夜做面條,火化后才能運回

      重慶美女美玲客死廣東,僅38歲,長期熬夜做面條,火化后才能運回

      裕豐娛間說
      2025-12-29 10:26:21
      全明星首輪投票結果出爐:東契奇暫列票王 詹杜排名下降庫里上升

      全明星首輪投票結果出爐:東契奇暫列票王 詹杜排名下降庫里上升

      羅說NBA
      2025-12-30 06:12:59
      中方軍演第2天,賴清德表態,高市表態,特朗普:關系好,不收臺

      中方軍演第2天,賴清德表態,高市表態,特朗普:關系好,不收臺

      時時有聊
      2025-12-30 09:49:07
      如果已經寫不出打動人的新年獻詞,就不必再勉強寫下去

      如果已經寫不出打動人的新年獻詞,就不必再勉強寫下去

      呦呦鹿鳴
      2025-12-29 22:57:28
      重磅!波蘭空軍正式下場協助烏軍防空,迎戰俄來襲目標

      重磅!波蘭空軍正式下場協助烏軍防空,迎戰俄來襲目標

      史政先鋒
      2025-12-29 20:59:02
      暴跌99%虧損80億!中國市場200家全部關停,又一豪車巨頭扛不住了

      暴跌99%虧損80億!中國市場200家全部關停,又一豪車巨頭扛不住了

      財經八卦
      2025-12-28 20:53:31
      約基奇21+8傷退掘金慘負熱火 鮑威爾25分引8人上雙大勝

      約基奇21+8傷退掘金慘負熱火 鮑威爾25分引8人上雙大勝

      醉臥浮生
      2025-12-30 10:49:11
      633元羽絨服女子回應:衣服只穿一次,網友曬鐵證,不止穿過一次

      633元羽絨服女子回應:衣服只穿一次,網友曬鐵證,不止穿過一次

      奇思妙想草葉君
      2025-12-29 23:38:44
      為什么我不相信美國有斬殺線

      為什么我不相信美國有斬殺線

      小院之觀
      2025-12-29 06:30:09
      成都男子炸4S店最新!1死4傷現場慘烈,知情人曝猛料,都是被逼的

      成都男子炸4S店最新!1死4傷現場慘烈,知情人曝猛料,都是被逼的

      云景侃記
      2025-12-29 14:19:49
      被軍演逼急了,臺當局送大陸6個字,美日的反應果然如我們所料

      被軍演逼急了,臺當局送大陸6個字,美日的反應果然如我們所料

      千里持劍
      2025-12-29 12:10:42
      巴拿馬夜拆中巴友誼公園!挑釁還是鬧劇?

      巴拿馬夜拆中巴友誼公園!挑釁還是鬧???

      夷門王生
      2025-12-29 21:49:45
      中國對日本出手了這么久,結果海關數據一公布,全都傻眼了!

      中國對日本出手了這么久,結果海關數據一公布,全都傻眼了!

      青青子衿
      2025-12-30 01:05:10
      陳偉俊,被免職

      陳偉俊,被免職

      新京報政事兒
      2025-12-30 10:56:57
      新能源車的競爭終局,昊鉑用“三擔責”彰顯售后誠意與能力

      新能源車的競爭終局,昊鉑用“三擔責”彰顯售后誠意與能力

      汽車商業評論
      2025-12-28 17:37:21
      傷病退散,約基奇被隊友踩到腳疑似造成左膝過度伸展,現已離場

      傷病退散,約基奇被隊友踩到腳疑似造成左膝過度伸展,現已離場

      懂球帝
      2025-12-30 10:01:54
      26歲漂亮女孩驅車慘死河中,凌晨還在夜場上班!更多細節流出…

      26歲漂亮女孩驅車慘死河中,凌晨還在夜場上班!更多細節流出…

      火山詩話
      2025-12-30 06:34:39
      用黑熊和獅子處理尸體?泰國軍攻入柬埔寨賭場后,網友們不淡定了

      用黑熊和獅子處理尸體?泰國軍攻入柬埔寨賭場后,網友們不淡定了

      17譚
      2025-12-29 14:32:33
      泡泡瑪特開始五折甩賣,二手平臺上Labubu部分款式跌破原價,部分黃牛公開聲明“暫緩收購Labubu系列”

      泡泡瑪特開始五折甩賣,二手平臺上Labubu部分款式跌破原價,部分黃牛公開聲明“暫緩收購Labubu系列”

      極目新聞
      2025-12-29 19:54:13
      巨虧之下的鋼鐵行業,不斷停產、減人,鋼鐵工人未來何去何從?

      巨虧之下的鋼鐵行業,不斷停產、減人,鋼鐵工人未來何去何從?

      社會日日鮮
      2025-12-29 11:05:45
      2025-12-30 12:04:49
      知危 incentive-icons
      知危
      投資不立危墻之下
      515文章數 1829關注度
      往期回顧 全部

      科技要聞

      Manus官宣加入Meta,收購金額達數十億美金

      頭條要聞

      牛彈琴:普京一個電話后特朗普怒了 俄羅斯或猛烈報復

      頭條要聞

      牛彈琴:普京一個電話后特朗普怒了 俄羅斯或猛烈報復

      體育要聞

      這個59歲的胖子,還在表演“蝎子擺尾”

      娛樂要聞

      林俊杰官宣文案爭議!女方名字都不提

      財經要聞

      雷軍低調期,兄弟林斌在小米套現140億

      汽車要聞

      標配華為乾崑ADS 4 Pro 華境S明年上半年上市

      態度原創

      家居
      藝術
      教育
      房產
      時尚

      家居要聞

      當歸之宅 三胎圓滿居所

      藝術要聞

      謝稚柳雪景山水20圖

      教育要聞

      英國大學住宿心理問題引發關注!留學生該如何應對孤獨感?

      房產要聞

      重磅信號!2025最后幾天,三亞開發商開始集體漲價!

      碧姬·芭鐸,“穿衣自由”概念的祖師奶

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 无码人妻一区二区三区一| 五十路熟妇| 久久久久无码中| 91在线精品视频| 丹寨县| 国产v片在线播放| 91在线视频播放| 天天夜碰日日摸日日澡性色av| 欧美交换配乱吟粗大25p| 欧美日韩精品一区二区在线观看| 亚洲性猛交xxxx| 免费视频国产在线观看| 丰都县| jizz亚洲人| 久久18禁| 国产精品偷伦费观看一次| 免费成人AV| 另类 专区 欧美 制服| 日本最新免费二区三区| 无套内内射视频网站| 久久99国产乱子伦精品免费| 六十路熟妇乱子伦| 久久福利导航| 亚洲19p| 新民市| 亚洲精品一卡| 佛教| 久久精人人妻一区二区三区| 五月丁香色情| 国产成人精品2021欧美日韩| 日本边吃奶边摸边做在线视频| 超碰aⅴ人人做人人爽欧美| 亚洲自拍偷拍激情视频| 无套内谢少妇毛片A片樱花| 潮喷无码正在播放| 日韩av无码精品一二三区| 中文字幕在线亚洲| 建平县| 成人做爰69片免费看网站野花| 亚洲一区精品伊人久久| 熟女?国产?精品|