<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeekV3.2技術報告還是老外看得細

      0
      分享至

      henry 發自 凹非寺
      量子位 | 公眾號

      ChatGPT三歲生日這一天,硅谷熱議的新模型來自DeepSeek

      準確說是兩款開源模型——DeepSeek-V3.2DeepSeek-V3.2-Speciale

      這倆模型火到什么程度呢?

      有網友表示,在去圣地亞哥的(疑似趕場NeurIPS 2025)航班上,有30%的乘客都在對著DeepSeek的PDF兩眼冒光。



      而上周嘲諷DeepSeek “曇花一現”的推特更是在發布的當晚被刷到了500萬瀏覽。



      除了普通網友,奧特曼也是急急急急:不僅啟動紅色警報,還臨時推遲了在ChatGPT上投放廣告的計劃。

      與此同時,那一頭的谷歌也沒被放過。

      網友直接 “靈魂喊話” 谷歌Gemini團隊:別睡了,DeepSeek回來了。



      這是怎么一回事?

      閉源精銳?打的就是閉源精銳!

      總的來說,DeepSeek-V3.2模型在智能體評測中達到了當前開源模型的最高水平,大幅縮小了開源模型與頂尖閉源模型的差距,并宣告了閉源落后開源的結束。



      其中,標準版DeepSeek-V3.2在推理測試中,達到了GPT-5的水平,僅略低于Gemini-3.0-Pro。

      而“特別版”DeepSeek-V3.2-Speciale不僅全方位超越了GPT-5,還能在主流推理任務中和Gemini-3.0-Pro掰掰手腕。

      此外,V3.2-Special還拿下了IMO、CMO、ICPC及IOI的金牌,并在ICPC和IOI上達到了人類選手第二名與第十名的水平。

      這不僅擊碎了開源模型落后閉源模型半年的質疑,又順便給硅谷的閉源AI公司好好上了一波壓力。



      而且,這還不是V4/R2。

      換句話說,大菜還沒上呢,光涼菜就已經讓硅谷吃飽了。



      對于DeepSeek-V3.2這次的成績,DeepSeek研究院茍志斌(Zhibin Gou)在推特上給出了相當直覺性的解答:

      強化學習在長上下文長度下也能持續擴展。

      為了理解這句話,我們簡要地回顧一下論文。

      簡單來說,DeepSeek-V3.2其實干了這么幾件事:

      首先,利用DSA稀疏注意力解決了長上下文的效率問題,為后續的長序列強化學習打下了計算基礎。

      接下來,通過引入可擴展的RL,并投入超過預訓練成本10%的算力進行后訓練,大幅提升模型的通用推理和智能體能力。

      最后,DeepSeek-V3.2-Speciale版本為了探索推理能力的極限,特意放寬了RL的長度限制,允許模型生成極長的“思維鏈”,迫使模型通過大量的Token生成來進行深度的自我修正和探索。

      這也就是說,通過長思維鏈讓模型思考更多,通過自我修正探索讓模型思考更久,進而解鎖更強的推理能力。

      由此,模型就能在不增加預訓練規模的情況下,通過極長的思考(消耗更多token)過程實現性能的飛躍。

      而上面的實驗結果,恰恰證明了這套“在超長上下文下持續擴展強化學習”路線的正確性。

      正如茍志斌所說:

      • 如果說Gemini-3證明了:預訓練可以持續擴展,那么DeepSeek-V3.2-Speciale 則證明了:強化學習在長上下文長度下也能持續擴展。
      • 我們花了一年時間把 DeepSeek-V3 逼到極限。得到的教訓是:
      • 后訓練階段的瓶頸,不是等“更好的底座模型”來解決,而是靠方法和數據本身的精煉(refine)來解決。



      換句話說,如果說Gemini-3 靠“堆知識(預訓練)”贏得了上半場,那么DeepSeek-V3.2-Speciale則通過“堆思考(長上下文RL)”贏回了下半場。

      此外,對于大模型已經撞到天花板了的論調,他表示:

      • 預訓練能scaling,RL也能scaling,context也能scaling,所有維度都還在上漲。



      這表明RL不僅有效,還能通過scaling(更大 batch、更長context、更豐富任務)獲得巨額收益

      同時,在論文中,也有網友發現了為什么DeepSeek-V3.2在HLE和GPQA 等知識基準測試中表現稍遜:

      因為計算資源有限!而單靠強化學習是無法達到這樣的水平的。



      換句話說,DeepSeek與頂尖模型的差距已經不是技術問題,而是經濟問題

      只要卡夠,好的開源不比閉源差!

      想到會便宜,沒想到會便宜這么多

      除了性能上持平頂尖閉源模型外,DeepSeek-V3.2系列這次也著實讓大家見識到了“智能便宜到不用計費”。



      如果從百萬token輸出成本來看,DeepSeek-V3.2比GPT-5便宜近24倍,比Gemini 3 Pro,便宜近29倍。



      而隨著輸出token個數的增加,這個差距最高可拉大到43倍

      這是什么概念呢?就好比你讓大模型一次性“寫”出一套《三體》三部曲,用GPT-5你大概需要八百塊,Gemini 3 Pro需要一千塊。

      用DeepSeekV3.2只需要差不多35塊錢!

      所以,性能差不多,價格卻能差出幾十倍。該選哪邊,答案不用多說了吧?

      對此,有網友表示,DeepSeek-V3.2這一經濟實惠的開源模型正在挑戰Gemini3.0 Pro。



      而另一頭OpenAI昂貴的訂閱費,瞬間就不順眼了。



      當然,這并不是說DeepSeekV3.2毫無缺點。

      正如一位網友指出的,同樣解決一個問題,Gemini只需要2萬個token,而Speciale則需要花費7.7萬個。

      (這實際上也是上面長下文RL的trade off)



      不過,低廉的價格也在一定程度上彌補了現階段Speciale版本的弱點。

      總的來說,DeepSeek仍舊是更實惠的那個。

      除此之外,也許更讓硅谷感到頭疼的就是DeepSeek-V3.2還可能直接在國產算力(華為、寒武紀)中部署,而這將進一步拉低模型推理的成本。

      此前,在發布DeepSeek-V3.2-Exp時,DeepSeek在發布首日就針對華為Ascend硬件和CANN軟件棧進行了優化。

      這次的DeepSeek-V3.2系列雖然沒有明確表示,但大概率也會延續此前的戰略。

      換句話說,難過可能的不止是谷歌和OpenAI,還有他們的好兄弟——英偉達。



      然而,這里的價格還只是模型公司的定價,并非推理的實際成本。

      盡管我們無法得知各家模型實際的推理成本,但從DeepSeek的技術報告中可以看到一個清晰趨勢:

      相較于前一代模型DeepSeek-V3.1-Terminus,DeepSeek-V3.2在最長上下文(128K)場景下,成本降低了75%83%左右。



      這意味著隨著注意力機制與后訓練的不斷優化,底層推理成本正在持續下探

      正如一位網友所總結的那樣:

      • DeepSeek證明了:實現強大的AI,并不一定需要夸張的資本投入。



      [1]https://x.com/airesearch12/status/1995465802040983960

      [2]https://www.nbcnews.com/tech/innovation/silicon-valley-building-free-chinese-ai-rcna242430

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      俄媒:莫斯科迪納摩將于1月下旬舉行友誼賽,申花將參賽

      俄媒:莫斯科迪納摩將于1月下旬舉行友誼賽,申花將參賽

      懂球帝
      2025-12-30 12:29:19
      全新奧迪A6L現身街頭,外觀變化大,華為智駕,2.0T/3.0T,會火嗎

      全新奧迪A6L現身街頭,外觀變化大,華為智駕,2.0T/3.0T,會火嗎

      紅濤說車
      2025-12-30 16:40:49
      中國減持美債至7601億,魯比奧警告日本,石破茂緊隨反水

      中國減持美債至7601億,魯比奧警告日本,石破茂緊隨反水

      星辰夜語
      2025-12-30 18:15:14
      央視跨年晚會官宣,備受期待嘉賓排名出爐:刀郎上榜,周深排第4

      央視跨年晚會官宣,備受期待嘉賓排名出爐:刀郎上榜,周深排第4

      阿纂看事
      2025-12-30 14:39:34
      市場逼近崩盤,總理罕見用中文發聲,一句“對不起”能否獲得原諒

      市場逼近崩盤,總理罕見用中文發聲,一句“對不起”能否獲得原諒

      百科密碼
      2025-12-29 15:20:24
      美國告知中國,選好了主戰場!新的交鋒即將開始,中方把話說透

      美國告知中國,選好了主戰場!新的交鋒即將開始,中方把話說透

      滄海旅行家
      2025-12-30 18:18:38
      交流結束,蔣萬安閃電離滬,上飛機前通告全島,臺當局捅了馬蜂窩

      交流結束,蔣萬安閃電離滬,上飛機前通告全島,臺當局捅了馬蜂窩

      科普100克克
      2025-12-30 18:08:15
      挑釁原配、“睡”遍京圈,定居美國7年的徐靜蕾,私生活太狂野了

      挑釁原配、“睡”遍京圈,定居美國7年的徐靜蕾,私生活太狂野了

      時光在作祟
      2025-12-27 18:37:45
      大家盼的終究來了!大陸攔截向臺灣運載“海馬斯”火箭長榮貨輪

      大家盼的終究來了!大陸攔截向臺灣運載“海馬斯”火箭長榮貨輪

      頭條爆料007
      2025-12-30 17:24:39
      毛主席逝世,將軍悲痛欲絕,稱“想回到他身邊”,隨后,安然而逝

      毛主席逝世,將軍悲痛欲絕,稱“想回到他身邊”,隨后,安然而逝

      覃仕勇說史
      2025-12-30 17:41:24
      養老金核定表核對指南:江蘇退休人別漏看3處關鍵,錯1項可能少領

      養老金核定表核對指南:江蘇退休人別漏看3處關鍵,錯1項可能少領

      金哥說新能源車
      2025-12-30 10:44:31
      血常規檢查中最怕這4項指標出現異常!提醒:大概率會影響壽命

      血常規檢查中最怕這4項指標出現異常!提醒:大概率會影響壽命

      健康之光
      2025-12-30 10:13:22
      內斗再開?國民黨中央委員選舉,朱立倫大獲成功,鄭麗文排名靠后

      內斗再開?國民黨中央委員選舉,朱立倫大獲成功,鄭麗文排名靠后

      策前論
      2025-12-29 12:20:16
      美司令曾警告:若大陸武力收臺,美軍將摧毀中方火箭軍和核武庫!

      美司令曾警告:若大陸武力收臺,美軍將摧毀中方火箭軍和核武庫!

      壹知眠羊
      2025-12-21 07:15:19
      曾被吹捧上天,如今卻淪為笑柄的6個坑人物品,大家別再買了!

      曾被吹捧上天,如今卻淪為笑柄的6個坑人物品,大家別再買了!

      室內設計師有料兒
      2025-12-27 17:07:20
      林澤昌任財政部黨組成員、副部長

      林澤昌任財政部黨組成員、副部長

      界面新聞
      2025-12-30 17:56:39
      大反轉,遼寧隊慘敗卻收兩個好消息,超級巨星有望加入中國男籃

      大反轉,遼寧隊慘敗卻收兩個好消息,超級巨星有望加入中國男籃

      宗介說體育
      2025-12-30 17:41:58
      新疆維吾爾自治區烏魯木齊市委原常委巴哈特·何德爾拜接受審查調查

      新疆維吾爾自治區烏魯木齊市委原常委巴哈特·何德爾拜接受審查調查

      界面新聞
      2025-12-30 15:01:18
      35歲成都街頭崩潰:那個被“精致窮”毀掉的姑娘,給所有人警示!

      35歲成都街頭崩潰:那個被“精致窮”毀掉的姑娘,給所有人警示!

      涵豆說娛
      2025-12-30 14:06:28
      2026年1月1日起,一批新規將施行!

      2026年1月1日起,一批新規將施行!

      新華社
      2025-12-30 16:50:07
      2025-12-30 19:36:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      11946文章數 176352關注度
      往期回顧 全部

      科技要聞

      估值150億的智元,開始批量"制造"小獨角獸

      頭條要聞

      副局長婚內與異性開房 前妻向紀委舉報其違規接受宴請

      頭條要聞

      副局長婚內與異性開房 前妻向紀委舉報其違規接受宴請

      體育要聞

      這個59歲的胖子,還在表演“蝎子擺尾”

      娛樂要聞

      林俊杰女友被扒 父親涉經濟案卷款13億?

      財經要聞

      朱光耀:美關稅政策正使WTO名存實亡

      汽車要聞

      標配華為乾崑ADS 4 Pro 華境S明年上半年上市

      態度原創

      時尚
      本地
      數碼
      家居
      軍事航空

      她們冬天這樣穿,真的很美!

      本地新聞

      即將過去的2025年,對重慶的影響竟然如此深遠

      數碼要聞

      海備思推出創意M.2移動硬盤盒,軟盤/文件夾造型

      家居要聞

      當歸之宅 三胎圓滿居所

      軍事要聞

      福建海警艦艇與臺海巡船對峙航行

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 黑人又大又粗免费视频| 成人乱人伦精品小说| 国产八区| 愛爱视频在线3| 老熟女网站| 久久人人97超碰国产精品| 亚洲中文字幕无码一区日日添| 蜜桃AV鲁一鲁| 亚洲综合无码明星蕉在线视频| 狠狠色噜噜狠狠狠狠色综合网 | 差差差很依人| 亚洲一区二区三区18禁| 国产精品va在线观看无码不卡| 中文字幕乱妇无码AV在线| 亚洲综合色婷婷中文字幕| 九九综合va免费看| 中国精品18videosex性中国| 无码爆乳护士让我爽| 久久久久国产精品熟女影院| 河北省| 于田县| 南丹县| 云阳县| 酒泉市| 色图综合网| 武隆县| 久久人妻在线| 91免费在线播放| 国产xxxxxx| 伊人五月综合| 巫山县| 色综合偷拍| 亚洲综合成人精品| 精品流白浆| 撕开奶罩揉吮奶头高潮av| 免费无码毛片一区二三区| 日韩欧美2| 国产精品无码专区| 经典国产乱子伦精品视频| 内射后入在线观看一区| 茄子av|