<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      新發代碼藏彩蛋!114個文件泄密 DeepSeek新模型為“MODEL1”?

      0
      分享至

      作者|子川

      來源|AI先鋒官

      作為明星產品,必須得用放大鏡看!

      正值DeepSeek-R1 發布一周年之際,DeepSeek 在 GitHub 上悄悄更新了一波代碼。

      結果,眼尖的開發者在 DeepSeek 核心的推理優化庫FlashMLA中,發現了一個此前從未公開過的神秘代號:“MODEL1”


      目前,行業內普遍猜測,這極有可能就是DeepSeek即將發布的下一代旗艦模型。

      而這次曝光的“MODEL1”,到底是什么來頭?

      首先,我們要知道它是怎么被發現的。

      這次泄露的源頭,來自DeepSeek的一個開源項目——FlashMLA

      可能大家對FlashMLA不太熟悉,這里給大家簡單介紹一下。

      這是DeepSeek自研工具,專門為英偉達GPU做深度優化。

      正是有了它,DeepSeek才能在模型架構層面減少內存占用,把GPU硬件的性能榨干到極致,從而實現了“低成本高性能”。

      而在最近更新的代碼中,開發者們發現在橫跨114個文件中,有28處都明確提到了“MODEL1”這個新標識符。

      在代碼邏輯里,“MODEL1”是與“V32”(也就是DeepSeek-V3.2)并列存在的。


      這意味著,它絕不是V3版本的簡單修補,而是一個采用了全新架構的獨立模型。

      根據技術大神的深度分析,“MODEL1”的核心變化主要體現在“回歸標準”和“極致效率”上。

      以前的V3模型,為了追求極致性能,采用了一種比較特殊的576維設計,而“MODEL1”則切換回了512維的標準配置。

      這樣做的好處非常明顯:它能更好地適配英偉達下一代Blackwell(SM100)芯片。

      不僅如此,“MODEL1”還引入了更高級的“稀疏化”技術。

      在代碼中,出現了大量針對FP8(8位浮點數)數據格式的解碼支持,以及鍵值(KV)緩存的優化。

      它能在處理極長內容時,智能地跳過不重要的計算步驟,同時利用FP8格式把記憶內容進行高保真壓縮。

      這直接帶來的結果就是:內存占用大幅降低,計算效率成倍提升。

      這意味著,可以用更便宜的顯卡,就能跑得動更強的模型。

      那么,這個“MODEL1”到底是傳說中的V4,還是推理模型R2?

      目前行業內主要有兩種看法。

      一種觀點認為,它是DeepSeek V4

      按照 DeepSeek 的命名慣例,在 V3.2 之后的旗艦級架構跨越,邏輯上即為 V4。

      并且此前就有外媒報道,DeepSeek計劃在2月(春節前后)發布新一代旗艦模型V4,且內部測試顯示其編程能力已經超越了市場上的頂級模型。

      另一種觀點則認為,它是DeepSeek R2

      最近一個月,DeepSeek團隊連續發布了兩篇重磅技術論文,介紹了一種名為“優化殘差連接(mHC)”的新訓練方法,以及一種模仿生物大腦的“AI記憶模塊(Engram)”。

      如果“MODEL1”整合了這些最新的黑科技,讓AI擁有了類似人類的記憶機制,那它極有可能就是備受期待的“推理之王”R2。

      不論是V4還是R2,至少有一點可以確定,DeepSeek的新模型快發布了!

      結合目前模型文件結構來看,“MODEL1”很可能已接近訓練完成或推理部署階段,正等待最終的權重凍結和測試驗證。

      這意味著,新模型的上線時間越來越近了。

      那個曾在全球掀起波瀾的“DeepSeek時刻”還會在今年重現嗎?我們拭目以待!

      掃碼邀請進群,我們帶你一起來玩轉ChatGPT、GPT-4、文心一言、通義千問、訊飛星火等AI大模型,順便學一些AI搞錢技能。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      美國華人直言:中國手機掃碼支付是最不智能的發明!

      美國華人直言:中國手機掃碼支付是最不智能的發明!

      阿傖說事
      2026-01-20 12:53:01
      默茨還沒在北京入座,德國對華鷹派先攤牌了,中方恐將以1敵27國

      默茨還沒在北京入座,德國對華鷹派先攤牌了,中方恐將以1敵27國

      奇奇圈
      2026-02-25 09:24:46
      當年舉債120億“吞”下沃爾沃!如今16年過去,李書福賺了多少?

      當年舉債120億“吞”下沃爾沃!如今16年過去,李書福賺了多少?

      牛鍋巴小釩
      2026-02-25 15:15:15
      明起,東莞開啟倒水模式!要曬衣被的趕緊!

      明起,東莞開啟倒水模式!要曬衣被的趕緊!

      東莞潮事兒
      2026-02-25 12:13:21
      一個非常不好的消息:中國超2億獨生子女面臨的非常嚴峻問題。

      一個非常不好的消息:中國超2億獨生子女面臨的非常嚴峻問題。

      百態人間
      2026-02-05 15:39:14
      坑慘了!網約車等乘客1個多小時被取消訂單,司機反被平臺罰了650

      坑慘了!網約車等乘客1個多小時被取消訂單,司機反被平臺罰了650

      用車指南
      2026-02-25 10:00:32
      美國一旦霸權結束,一定會滅亡的三個國家,排第一的果然是它

      美國一旦霸權結束,一定會滅亡的三個國家,排第一的果然是它

      霽寒飄雪
      2026-02-25 16:55:39
      “我就是她取精生子的工具”清華學霸哭訴,撕開了女富豪的遮羞布

      “我就是她取精生子的工具”清華學霸哭訴,撕開了女富豪的遮羞布

      北緯的咖啡豆
      2026-02-20 19:12:17
      伊朗要死!

      伊朗要死!

      求實處
      2026-02-22 17:53:28
      笑裂了,山航起飛心驟停,網友:謝謝機長不殺之恩!

      笑裂了,山航起飛心驟停,網友:謝謝機長不殺之恩!

      夜深愛雜談
      2025-12-09 20:24:32
      重磅實錘!俄親戰大V自曝:俄軍進攻潛力已耗盡

      重磅實錘!俄親戰大V自曝:俄軍進攻潛力已耗盡

      老馬拉車莫少裝
      2026-02-25 08:57:51
      打伊朗前,美國找到中國,特朗普知道:他錯一步,中國就不戰而勝

      打伊朗前,美國找到中國,特朗普知道:他錯一步,中國就不戰而勝

      頭條爆料007
      2026-02-24 14:44:25
      貝加爾湖慘案只報“救出一人”,本質就是護著俄羅斯的臉面

      貝加爾湖慘案只報“救出一人”,本質就是護著俄羅斯的臉面

      壹家言
      2026-02-25 16:11:34
      可打航母!外媒:中國超音武器將運往伊朗,美150架戰機急飛中東

      可打航母!外媒:中國超音武器將運往伊朗,美150架戰機急飛中東

      黑鷹觀軍事
      2026-02-25 17:48:10
      天安門廣場上的國家博物館將在北京豐臺建分館

      天安門廣場上的國家博物館將在北京豐臺建分館

      澎湃新聞
      2026-02-25 12:54:27
      直線跳水!605033,突發“天地板”

      直線跳水!605033,突發“天地板”

      中國基金報
      2026-02-25 14:29:20
      春節剛過,鄭麗文態度變了,她這次要親自和美國談,打一場硬仗

      春節剛過,鄭麗文態度變了,她這次要親自和美國談,打一場硬仗

      健身狂人
      2026-02-25 16:27:04
      越發上頭,“日本強,美國挺,抗中國”

      越發上頭,“日本強,美國挺,抗中國”

      觀察者網
      2026-02-25 12:01:35
      別被馬斯克忽悠了!星鏈撐不起人類通訊,中國通信基建才是底氣

      別被馬斯克忽悠了!星鏈撐不起人類通訊,中國通信基建才是底氣

      像夢一場a
      2026-02-13 20:20:26
      鞏俐21歲時寫的字,顛覆了我的想象!

      鞏俐21歲時寫的字,顛覆了我的想象!

      石場阿鑫
      2026-01-16 13:41:02
      2026-02-25 18:35:00
      AI先鋒官 incentive-icons
      AI先鋒官
      AIGC大模型及應用精選與評測
      437文章數 60關注度
      往期回顧 全部

      科技要聞

      “機器人只跳舞,沒什么用”

      頭條要聞

      女子被害留下3個女兒無人照顧 辦案警察接力資助15年

      頭條要聞

      女子被害留下3個女兒無人照顧 辦案警察接力資助15年

      體育要聞

      曝雄鹿計劃今夏追小卡 字母哥渴望與其并肩作戰

      娛樂要聞

      撒貝寧到沈陽跑親戚 老婆李白模特身材

      財經要聞

      GEO亂象:誰為AI營銷的泡沫買單?

      汽車要聞

      750km超長續航 2026款小鵬X9純電版將于3月2日上市

      態度原創

      房產
      旅游
      教育
      數碼
      健康

      房產要聞

      海南樓市春節熱銷地圖曝光!三亞、陵水又殺瘋了!

      旅游要聞

      大理伙山村的田園牧歌,終歸敗給了柴米油鹽,少去許多詩意和淡然

      教育要聞

      工程問題速解:人數增加后工期縮短多少?

      數碼要聞

      蘋果終于妥協?觸屏版MacBook Pro或將面世 靈動島也搬上大屏

      轉頭就暈的耳石癥,能開車上班嗎?

      無障礙瀏覽 進入關懷版