<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<cite id="y6grf"></cite>

<sub id="y6grf"><p id="y6grf"><li id="y6grf"></li></p></sub>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

新發代碼藏彩蛋！114個文件泄密 DeepSeek新模型為“MODEL1”？

2026-01-22 01:06:38　來源: AI先鋒官

北京舉報

0

分享至

作者｜子川

來源｜AI先鋒官

作為明星產品，必須得用放大鏡看！

正值DeepSeek-R1 發布一周年之際，DeepSeek 在 GitHub 上悄悄更新了一波代碼。

結果，眼尖的開發者在 DeepSeek 核心的推理優化庫FlashMLA中，發現了一個此前從未公開過的神秘代號：“MODEL1”。

目前，行業內普遍猜測，這極有可能就是DeepSeek即將發布的下一代旗艦模型。

而這次曝光的“MODEL1”，到底是什么來頭？

首先，我們要知道它是怎么被發現的。

這次泄露的源頭，來自DeepSeek的一個開源項目——FlashMLA。

可能大家對FlashMLA不太熟悉，這里給大家簡單介紹一下。

這是DeepSeek自研工具，專門為英偉達GPU做深度優化。

正是有了它，DeepSeek才能在模型架構層面減少內存占用，把GPU硬件的性能榨干到極致，從而實現了“低成本高性能”。

而在最近更新的代碼中，開發者們發現在橫跨114個文件中，有28處都明確提到了“MODEL1”這個新標識符。

在代碼邏輯里，“MODEL1”是與“V32”（也就是DeepSeek-V3.2）并列存在的。

這意味著，它絕不是V3版本的簡單修補，而是一個采用了全新架構的獨立模型。

根據技術大神的深度分析，“MODEL1”的核心變化主要體現在“回歸標準”和“極致效率”上。

以前的V3模型，為了追求極致性能，采用了一種比較特殊的576維設計，而“MODEL1”則切換回了512維的標準配置。

這樣做的好處非常明顯：它能更好地適配英偉達下一代Blackwell（SM100）芯片。

不僅如此，“MODEL1”還引入了更高級的“稀疏化”技術。

在代碼中，出現了大量針對FP8（8位浮點數）數據格式的解碼支持，以及鍵值（KV）緩存的優化。

它能在處理極長內容時，智能地跳過不重要的計算步驟，同時利用FP8格式把記憶內容進行高保真壓縮。

這直接帶來的結果就是：內存占用大幅降低，計算效率成倍提升。

這意味著，可以用更便宜的顯卡，就能跑得動更強的模型。

那么，這個“MODEL1”到底是傳說中的V4，還是推理模型R2？

目前行業內主要有兩種看法。

一種觀點認為，它是DeepSeek V4。

按照 DeepSeek 的命名慣例，在 V3.2 之后的旗艦級架構跨越，邏輯上即為 V4。

并且此前就有外媒報道，DeepSeek計劃在2月（春節前后）發布新一代旗艦模型V4，且內部測試顯示其編程能力已經超越了市場上的頂級模型。

另一種觀點則認為，它是DeepSeek R2。

最近一個月，DeepSeek團隊連續發布了兩篇重磅技術論文，介紹了一種名為“優化殘差連接（mHC）”的新訓練方法，以及一種模仿生物大腦的“AI記憶模塊（Engram）”。

如果“MODEL1”整合了這些最新的黑科技，讓AI擁有了類似人類的記憶機制，那它極有可能就是備受期待的“推理之王”R2。

不論是V4還是R2，至少有一點可以確定，DeepSeek的新模型快發布了！

結合目前模型文件結構來看，“MODEL1”很可能已接近訓練完成或推理部署階段，正等待最終的權重凍結和測試驗證。

這意味著，新模型的上線時間越來越近了。

那個曾在全球掀起波瀾的“DeepSeek時刻”還會在今年重現嗎？我們拭目以待！

掃碼邀請進群，我們帶你一起來玩轉ChatGPT、GPT-4、文心一言、通義千問、訊飛星火等AI大模型，順便學一些AI搞錢技能。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Moltbot作者被Claude刁難后：MiniMax M2.1是最優秀的開源模型

量子位 2026-01-29 13:17:17
21 跟貼 21
微信上線 “面對面收照片和文件” 功能，直傳無需加好友、不耗流量

界面新聞 2026-02-25 10:08:04
41 跟貼 41

訓練獎勵太稀疏？港中文聯合美團給Agent加上「過程分」

機器之心Pro 2026-02-25 17:27:26
0 跟貼 0

3倍吞吐量、訪存減至1/10！螞蟻甩出兩大萬億參數開源模型，背后架構成關鍵

智東西 2026-02-25 12:18:08
0 跟貼 0
QVGen讓「超低比特視頻生成量化」真正可用！

機器之心Pro 2026-02-25 18:07:24
0 跟貼 0

華為CLI-Gym：環境交互類任務首個公開的數據Scaling方案

機器之心Pro 2026-02-25 15:18:22
0 跟貼 0

嫌疑人當面刪代碼，挑釁警察不懂技術，警察自爆身份嚇傻嫌疑人

惠娥輕笑 2026-02-24 10:41:45
1 跟貼 1
只要1100美元tokens，一周重寫 Next.js！

機器之心Pro 2026-02-25 16:54:02
0 跟貼 0

龍蝦之父新訪談，OpenClaw內幕公開！攔不住濫用，只勸大家別玩火

量子位 2026-02-25 13:46:20
2 跟貼 2
如何為LLM智能體編寫工具？Anthropic官方教程來了

機器之心Pro 2025-09-12 21:50:08
0 跟貼 0
消費級顯卡可跑！剛剛，阿里Qwen3.5又開源3款新模型

機器之心Pro 2026-02-25 17:09:48
0 跟貼 0
“OpenClaw之父”：當“實驗項目”變成“全球爆款”，軟件開發本質已變——代碼已死、意圖永生

華爾街見聞官方 2026-02-25 11:17:27
0 跟貼 0
續航不升反降！4680版Model Y上架，特斯拉這操作太騷了！

極果酷玩 2026-02-25 12:14:09
2 跟貼 2
遭谷歌制裁，OpenClaw創始人：Anthropic會先打電話，直接封號

機器之心Pro 2026-02-25 17:49:33
0 跟貼 0
北航開源Code2Bench：雙擴展動態評測，代碼大模型告別躺平刷分

機器之心Pro 2026-02-25 15:51:27
0 跟貼 0
開源AI編程工具CoStrict，GitHub星標3K+

量子位 2025-12-09 01:52:08
0 跟貼 0
搶抓“DeepSeek”時刻！小鵬、吉利發聲

中國基金報 2026-02-24 20:18:46
16 跟貼 16
在給別人轉賬時，一定要添加這個動作

飄過的知識 2026-02-25 17:12:37
4 跟貼 4
嚴肅版AI編程助手 GitHub星標3k+

量子位 2025-12-08 15:29:06
0 跟貼 0
解碼世界的鑰匙！符號系統學輕松掌握

老蓋實話升學 2026-02-23 04:17:23
0 跟貼 0
Claude Code之父，推特親傳使用技巧，超 500 萬人關注

機器之心Pro 2026-01-05 13:26:18
0 跟貼 0
子公司產品遭FDA早期預警三諾生物：系基于企業主動更新產品說明作出

財聯社 2026-02-25 13:57:04
0 跟貼 0
開源鴻蒙重寫世界，從一行微小的代碼開始

量子位 2025-12-31 01:50:02
0 跟貼 0
一封絕密文件被公開，中國曾被寫進核滅絕計劃，他決定了中國底線

獨舞生活 2026-02-21 13:45:00
0 跟貼 0
賴清德終于要上立法院報告了？黃國昌爆出秘密文件！震驚全臺！

新時光點滴 2026-02-24 14:21:32
0 跟貼 0
英特爾再戰AI，聯手AI芯片初創押注推理市場

DeepTech深科技 2026-02-25 17:28:43
0 跟貼 0
警惕2026年最新騙局，小心避免上當！

左運新鮮事 2026-02-25 00:25:54
0 跟貼 0
300多只東北虎“輕斷食”？景區：每天斷食1個園，司機會帶游客找可投喂區

封面新聞 2026-02-23 16:29:03
1660 跟貼 1660
哈爾濱冰雪大世界：正式閉園

大風新聞 2026-02-21 20:36:03
1869 跟貼 1869
東北女孩接到詐騙電話把騙子聊抑郁了！

愛搞笑的六十秒 2026-02-25 10:43:02
0 跟貼 0
賬戶有錢卻取不出來？很可能已卷入騙局，近期99%的人全中招了

串兒姐看生活 2026-02-25 09:02:24
0 跟貼 0
男子在五米墻上跳下來，技術零幀起手，一般人在上面站著都腿軟！

逗趣冒險家 2026-02-23 16:27:22
1 跟貼 1
80%的人都會上當！新型網貸騙局，專挑心軟善良的人下手

椰椰奶糖 2026-02-25 06:38:10
0 跟貼 0
2026泊車終極修羅場！四大熱門車型三關死斗，硬件算法全曝光！

駕享來電 2026-02-21 08:32:30
7 跟貼 7
紫牛頭條 | 全家出游老人服務區內被狗撲咬骨折，犬主付千元后駕車離開，警方已立案

揚子晚報 2026-02-24 23:56:16
4 跟貼 4
2026，國產AI芯片，跨越天塹：從“推理”走向“訓練”

鈦媒體APP 2026-02-25 12:59:31
0 跟貼 0
手機出現這8個信號，說明你已經被監聽！一旦出現請立刻關機

大小關物語 2026-02-24 00:58:12
0 跟貼 0
泰州一15歲初中生在小紅書上被騙！

百曉生很小聲 2026-02-25 17:34:07
0 跟貼 0
騰訊元寶回應生成拜年海報出現臟話：模型處理多輪對話時輸出異常結果已緊急校正

紅星新聞 2026-02-25 14:04:28
85 跟貼 85
女子高速堵車走國道偶遇10年沒見過面的初戀，一眼認出對方車牌，確認后互相打招呼

大象新聞 2026-02-24 18:44:05
71 跟貼 71

美國華人直言：中國手機掃碼支付是最不智能的發明！

美國華人直言：中國手機掃碼支付是最不智能的發明！

阿傖說事

2026-01-20 12:53:01

默茨還沒在北京入座，德國對華鷹派先攤牌了，中方恐將以1敵27國

默茨還沒在北京入座，德國對華鷹派先攤牌了，中方恐將以1敵27國

奇奇圈

2026-02-25 09:24:46

當年舉債120億“吞”下沃爾沃！如今16年過去，李書福賺了多少？

當年舉債120億“吞”下沃爾沃！如今16年過去，李書福賺了多少？

牛鍋巴小釩

2026-02-25 15:15:15

明起，東莞開啟倒水模式！要曬衣被的趕緊！

明起，東莞開啟倒水模式！要曬衣被的趕緊！

東莞潮事兒

2026-02-25 12:13:21

一個非常不好的消息：中國超2億獨生子女面臨的非常嚴峻問題。

一個非常不好的消息：中國超2億獨生子女面臨的非常嚴峻問題。

百態人間

2026-02-05 15:39:14

坑慘了！網約車等乘客1個多小時被取消訂單，司機反被平臺罰了650

坑慘了！網約車等乘客1個多小時被取消訂單，司機反被平臺罰了650

用車指南

2026-02-25 10:00:32

美國一旦霸權結束，一定會滅亡的三個國家，排第一的果然是它

美國一旦霸權結束，一定會滅亡的三個國家，排第一的果然是它

霽寒飄雪

2026-02-25 16:55:39

“我就是她取精生子的工具”清華學霸哭訴，撕開了女富豪的遮羞布

“我就是她取精生子的工具”清華學霸哭訴，撕開了女富豪的遮羞布

北緯的咖啡豆

2026-02-20 19:12:17

伊朗要死！

求實處

2026-02-22 17:53:28

笑裂了，山航起飛心驟停，網友:謝謝機長不殺之恩！

笑裂了，山航起飛心驟停，網友:謝謝機長不殺之恩！

夜深愛雜談

2025-12-09 20:24:32

重磅實錘！俄親戰大V自曝：俄軍進攻潛力已耗盡

重磅實錘！俄親戰大V自曝：俄軍進攻潛力已耗盡

老馬拉車莫少裝

2026-02-25 08:57:51

打伊朗前，美國找到中國，特朗普知道：他錯一步，中國就不戰而勝

打伊朗前，美國找到中國，特朗普知道：他錯一步，中國就不戰而勝

頭條爆料007

2026-02-24 14:44:25

貝加爾湖慘案只報“救出一人”，本質就是護著俄羅斯的臉面

貝加爾湖慘案只報“救出一人”，本質就是護著俄羅斯的臉面

壹家言

2026-02-25 16:11:34

可打航母！外媒：中國超音武器將運往伊朗，美150架戰機急飛中東

可打航母！外媒：中國超音武器將運往伊朗，美150架戰機急飛中東

黑鷹觀軍事

2026-02-25 17:48:10

天安門廣場上的國家博物館將在北京豐臺建分館

天安門廣場上的國家博物館將在北京豐臺建分館

澎湃新聞

2026-02-25 12:54:27

直線跳水！605033，突發“天地板”

直線跳水！605033，突發“天地板”

中國基金報

2026-02-25 14:29:20

春節剛過，鄭麗文態度變了，她這次要親自和美國談，打一場硬仗

春節剛過，鄭麗文態度變了，她這次要親自和美國談，打一場硬仗

健身狂人

2026-02-25 16:27:04

越發上頭，“日本強，美國挺，抗中國”

越發上頭，“日本強，美國挺，抗中國”

觀察者網

2026-02-25 12:01:35

別被馬斯克忽悠了！星鏈撐不起人類通訊，中國通信基建才是底氣

別被馬斯克忽悠了！星鏈撐不起人類通訊，中國通信基建才是底氣

像夢一場a

2026-02-13 20:20:26

鞏俐21歲時寫的字，顛覆了我的想象！

鞏俐21歲時寫的字，顛覆了我的想象！

石場阿鑫

2026-01-16 13:41:02

AIGC大模型及應用精選與評測

437文章數 60關注度

往期回顧全部

科技要聞

“機器人只跳舞，沒什么用”

頭條要聞

女子被害留下3個女兒無人照顧辦案警察接力資助15年

頭條要聞

女子被害留下3個女兒無人照顧辦案警察接力資助15年

體育要聞

曝雄鹿計劃今夏追小卡字母哥渴望與其并肩作戰

娛樂要聞

撒貝寧到沈陽跑親戚老婆李白模特身材

財經要聞

GEO亂象：誰為AI營銷的泡沫買單？

汽車要聞

750km超長續航 2026款小鵬X9純電版將于3月2日上市

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

房產

旅游

教育

數碼

健康

房產要聞

海南樓市春節熱銷地圖曝光！三亞、陵水又殺瘋了！

旅游要聞

大理伙山村的田園牧歌，終歸敗給了柴米油鹽，少去許多詩意和淡然

教育要聞

工程問題速解：人數增加后工期縮短多少？

數碼要聞

蘋果終于妥協？觸屏版MacBook Pro或將面世靈動島也搬上大屏

轉頭就暈的耳石癥，能開車上班嗎？

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<sub id="lzqp1"></sub>

<em id="lzqp1"></em>

<sub id="lzqp1"></sub>