<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<tr id="euody"></tr>

<wbr id="euody"></wbr>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

DeepSeekV3.2技術報告還是老外看得細

2025-12-04 08:53:34　來源: 量子位

北京舉報

0

分享至

henry 發自凹非寺
量子位 | 公眾號

ChatGPT三歲生日這一天，硅谷熱議的新模型來自DeepSeek

準確說是兩款開源模型——DeepSeek-V3.2DeepSeek-V3.2-Speciale

這倆模型火到什么程度呢？

有網友表示，在去圣地亞哥的（疑似趕場NeurIPS 2025）航班上，有30%的乘客都在對著DeepSeek的PDF兩眼冒光。

而上周嘲諷DeepSeek “曇花一現”的推特更是在發布的當晚被刷到了500萬瀏覽。

除了普通網友，奧特曼也是急急急急：不僅啟動紅色警報，還臨時推遲了在ChatGPT上投放廣告的計劃。

與此同時，那一頭的谷歌也沒被放過。

網友直接 “靈魂喊話” 谷歌Gemini團隊：別睡了，DeepSeek回來了。

這是怎么一回事？

閉源精銳？打的就是閉源精銳！

總的來說，DeepSeek-V3.2模型在智能體評測中達到了當前開源模型的最高水平，大幅縮小了開源模型與頂尖閉源模型的差距，并宣告了閉源落后開源的結束。

其中，標準版DeepSeek-V3.2在推理測試中，達到了GPT-5的水平，僅略低于Gemini-3.0-Pro。

而“特別版”DeepSeek-V3.2-Speciale不僅全方位超越了GPT-5，還能在主流推理任務中和Gemini-3.0-Pro掰掰手腕。

此外，V3.2-Special還拿下了IMO、CMO、ICPC及IOI的金牌，并在ICPC和IOI上達到了人類選手第二名與第十名的水平。

這不僅擊碎了開源模型落后閉源模型半年的質疑，又順便給硅谷的閉源AI公司好好上了一波壓力。

而且，這還不是V4/R2。

換句話說，大菜還沒上呢，光涼菜就已經讓硅谷吃飽了。

對于DeepSeek-V3.2這次的成績，DeepSeek研究院茍志斌（Zhibin Gou）在推特上給出了相當直覺性的解答：

強化學習在長上下文長度下也能持續擴展。

為了理解這句話，我們簡要地回顧一下論文。

簡單來說，DeepSeek-V3.2其實干了這么幾件事：

首先，利用DSA稀疏注意力解決了長上下文的效率問題，為后續的長序列強化學習打下了計算基礎。

接下來，通過引入可擴展的RL，并投入超過預訓練成本10%的算力進行后訓練，大幅提升模型的通用推理和智能體能力。

最后，DeepSeek-V3.2-Speciale版本為了探索推理能力的極限，特意放寬了RL的長度限制，允許模型生成極長的“思維鏈”，迫使模型通過大量的Token生成來進行深度的自我修正和探索。

這也就是說，通過長思維鏈讓模型思考更多，通過自我修正探索讓模型思考更久，進而解鎖更強的推理能力。

由此，模型就能在不增加預訓練規模的情況下，通過極長的思考（消耗更多token）過程實現性能的飛躍。

而上面的實驗結果，恰恰證明了這套“在超長上下文下持續擴展強化學習”路線的正確性。

正如茍志斌所說：

如果說Gemini-3證明了：預訓練可以持續擴展，那么DeepSeek-V3.2-Speciale 則證明了：強化學習在長上下文長度下也能持續擴展。
我們花了一年時間把 DeepSeek-V3 逼到極限。得到的教訓是：
后訓練階段的瓶頸，不是等“更好的底座模型”來解決，而是靠方法和數據本身的精煉（refine）來解決。

換句話說，如果說Gemini-3 靠“堆知識（預訓練）”贏得了上半場，那么DeepSeek-V3.2-Speciale則通過“堆思考（長上下文RL）”贏回了下半場。

此外，對于大模型已經撞到天花板了的論調，他表示：

預訓練能scaling，RL也能scaling，context也能scaling，所有維度都還在上漲。

這表明RL不僅有效，還能通過scaling（更大 batch、更長context、更豐富任務）獲得巨額收益

同時，在論文中，也有網友發現了為什么DeepSeek-V3.2在HLE和GPQA 等知識基準測試中表現稍遜：

因為計算資源有限！而單靠強化學習是無法達到這樣的水平的。

換句話說，DeepSeek與頂尖模型的差距已經不是技術問題，而是經濟問題

只要卡夠，好的開源不比閉源差！

想到會便宜，沒想到會便宜這么多

除了性能上持平頂尖閉源模型外，DeepSeek-V3.2系列這次也著實讓大家見識到了“智能便宜到不用計費”。

如果從百萬token輸出成本來看，DeepSeek-V3.2比GPT-5便宜近24倍，比Gemini 3 Pro，便宜近29倍。

而隨著輸出token個數的增加，這個差距最高可拉大到43倍

這是什么概念呢？就好比你讓大模型一次性“寫”出一套《三體》三部曲，用GPT-5你大概需要八百塊，Gemini 3 Pro需要一千塊。

用DeepSeekV3.2只需要差不多35塊錢！

所以，性能差不多，價格卻能差出幾十倍。該選哪邊，答案不用多說了吧？

對此，有網友表示，DeepSeek-V3.2這一經濟實惠的開源模型正在挑戰Gemini3.0 Pro。

而另一頭OpenAI昂貴的訂閱費，瞬間就不順眼了。

當然，這并不是說DeepSeekV3.2毫無缺點。

正如一位網友指出的，同樣解決一個問題，Gemini只需要2萬個token，而Speciale則需要花費7.7萬個。

（這實際上也是上面長下文RL的trade off）

不過，低廉的價格也在一定程度上彌補了現階段Speciale版本的弱點。

總的來說，DeepSeek仍舊是更實惠的那個。

除此之外，也許更讓硅谷感到頭疼的就是DeepSeek-V3.2還可能直接在國產算力（華為、寒武紀）中部署，而這將進一步拉低模型推理的成本。

此前，在發布DeepSeek-V3.2-Exp時，DeepSeek在發布首日就針對華為Ascend硬件和CANN軟件棧進行了優化。

這次的DeepSeek-V3.2系列雖然沒有明確表示，但大概率也會延續此前的戰略。

換句話說，難過可能的不止是谷歌和OpenAI，還有他們的好兄弟——英偉達。

然而，這里的價格還只是模型公司的定價，并非推理的實際成本。

盡管我們無法得知各家模型實際的推理成本，但從DeepSeek的技術報告中可以看到一個清晰趨勢：

相較于前一代模型DeepSeek-V3.1-Terminus，DeepSeek-V3.2在最長上下文（128K）場景下，成本降低了75%83%左右。

這意味著隨著注意力機制與后訓練的不斷優化，底層推理成本正在持續下探

正如一位網友所總結的那樣：

DeepSeek證明了：實現強大的AI，并不一定需要夸張的資本投入。

[1]https://x.com/airesearch12/status/1995465802040983960

[2]https://www.nbcnews.com/tech/innovation/silicon-valley-building-free-chinese-ai-rcna242430

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

小米跨年直播定了！雷軍將親自抄家伙，直播拆車！

雷科技 2025-12-30 16:22:37
2 跟貼 2
15%全量Attention！「RTPurbo」阿里Qwen3長文本推理5倍壓縮方案

機器之心Pro 2025-12-23 12:52:34
0 跟貼 0

LLaVA-OneVision-1.5開源，8B模型預訓練只需4天、1.6萬美元

機器之心Pro 2025-10-13 18:37:02
0 跟貼 0

用不同軟件制作

評論員李煒 2025-12-26 14:46:27
0 跟貼 0
字節Seed團隊發布循環語言模型Ouro，在預訓練階段直接「思考」

機器之心Pro 2025-11-04 11:58:36
0 跟貼 0

美烏總統談了3小時特朗普被指發表"最令人震驚言論"

環球網資訊 2025-12-30 07:02:23
6044 跟貼 6044

價格飆升，多地零售價突破10元/斤！年初一斤僅一兩元，網友：雞蛋都快配不上它了

每日經濟新聞 2025-12-26 10:01:26
6210 跟貼 6210
成本0.3美元，耗時26分鐘！CudaForge：顛覆性低成本CUDA優化框架

機器之心Pro 2025-11-17 18:45:03
0 跟貼 0

卡帕西推薦的AI Coding指南：3招教你效率翻倍

量子位 2025-12-30 14:53:47
0 跟貼 0
句子級溯源+生成式歸因，C2-Cite重塑大模型可信度

機器之心Pro 2025-12-03 10:33:12
0 跟貼 0
架構解耦是統一多模態模型所必須的嗎？全新AIA損失：No

機器之心Pro 2025-12-02 14:25:38
0 跟貼 0
持續燒錢的大模型，阻擋不了AI行業的熱情

鈦媒體APP 2025-12-29 09:49:07
0 跟貼 0
AAAI 2026 Oral｜LENS：基于統一強化推理的分割大模型

機器之心Pro 2025-12-29 14:57:57
5 跟貼 5
鋼管鍛造打孔技術

孑孑動漫 2025-12-29 19:50:22
1 跟貼 1
今年TRAE寫的代碼：100000000000行！超50%程序員每天在按Tab鍵

量子位 2025-12-29 13:38:06
19 跟貼 19
PixelRefer ：讓AI從“看大圖”走向“看懂每個對象”

機器之心Pro 2025-11-11 12:49:23
0 跟貼 0
高手就是高手，這模型做的太仿真了，不服都不行啊

制造科技 2025-12-30 13:11:50
0 跟貼 0
帥到犯規！樊振東這記發球，卡點比音樂軟件還精準

體育熱點探索者 2025-12-28 20:28:27
1 跟貼 1
吳恩達年度AI總結來了！附帶一份軟件開發學習小tips

量子位 2025-12-30 14:43:51
0 跟貼 0
QwenLong-L1.5發布：讓30B MoE模型長文本推理能力媲美GPT-5

機器之心Pro 2025-12-29 14:50:14
6 跟貼 6
拒絕智能手機，炮轟ChatGPT，沒有他就沒有今天的互聯網

DeepTech深科技 2025-12-26 18:07:26
27 跟貼 27
人和人的差距，就在這五個維度上

小G侃商業 2025-12-29 21:27:52
1 跟貼 1
原本以為是實景拍攝，沒想到全是手工打造的微縮模型

大嘴電影 2025-12-29 20:06:05
1 跟貼 1
男生帶著大疆人體攝像機6pro+去球場，不僅能執法還能自瞄！

理想之聲 2025-12-28 19:05:12
0 跟貼 0
胡先煦罵人技術高超，一句話直接懟沈騰黃景瑜兩人，看呆丨出發3

史鹷的生活科普 2025-12-30 01:18:11
1 跟貼 1
我手搓了一份 AI 版網易云年度報告，快來認領你的年度模型｜附教程

愛范兒 2025-12-29 14:12:42
0 跟貼 0
上交聯合UCSD突破LLM推理瓶頸，模型代碼全開源

機器之心Pro 2025-12-30 15:36:50
0 跟貼 0
中國兩家航司同日官宣：合計采購55架空客飛機，總金額超570億元

每日經濟新聞 2025-12-30 00:23:17
1671 跟貼 1671
吳恩達年終總結：2025是AI工業時代的黎明

機器之心Pro 2025-12-30 15:05:38
0 跟貼 0
復刻模型大師

書童愛搞笑 2025-12-27 11:52:46
1 跟貼 1
《新聞聯播》放了這段畫面！無人機俯瞰臺北101

看看新聞Knews 2025-12-30 00:21:18
132 跟貼 132
標配華為乾崑ADS 4 Pro 華境S明年上半年上市

網易汽車 2025-12-30 07:43:24
12 跟貼 12
中國學生籃球技術火爆外網，老外紛紛點贊：未來的NBA球星！

搞笑桔子 2025-12-28 00:09:21
6 跟貼 6
國外網友評論讓世界震撼的中國造橋技術！棒子處于嬰兒吃奶階段

愛歌唱的叮當貓 2025-12-29 13:48:20
0 跟貼 0
收評：滬指收出10連陽機器人概念持續爆發

財聯社 2025-12-30 15:02:09
703 跟貼 703
076四川艦出現無人僚機模型，快速無人化沖灘，統一大業快了

閆樹軍論評 2025-12-28 17:36:23
1 跟貼 1
山西大同一小區禁止新能源車進地庫，街道辦：正在解決中

新京報 2025-12-30 16:31:09
10 跟貼 10
越南政府：確保南北高鐵項目在2026年底前開工建設

財聯社 2025-12-30 17:00:40
1 跟貼 1
Manus“上岸”

華爾街見聞官方 2025-12-30 19:07:32
0 跟貼 0
模型不用微調，靠上下文就能自我進化？

機器之心Pro 2025-10-11 20:20:59
0 跟貼 0

俄媒：莫斯科迪納摩將于1月下旬舉行友誼賽，申花將參賽

俄媒：莫斯科迪納摩將于1月下旬舉行友誼賽，申花將參賽

懂球帝

2025-12-30 12:29:19

全新奧迪A6L現身街頭，外觀變化大，華為智駕，2.0T/3.0T，會火嗎

全新奧迪A6L現身街頭，外觀變化大，華為智駕，2.0T/3.0T，會火嗎

紅濤說車

2025-12-30 16:40:49

中國減持美債至7601億，魯比奧警告日本，石破茂緊隨反水

中國減持美債至7601億，魯比奧警告日本，石破茂緊隨反水

星辰夜語

2025-12-30 18:15:14

央視跨年晚會官宣，備受期待嘉賓排名出爐：刀郎上榜，周深排第4

央視跨年晚會官宣，備受期待嘉賓排名出爐：刀郎上榜，周深排第4

阿纂看事

2025-12-30 14:39:34

市場逼近崩盤，總理罕見用中文發聲，一句“對不起”能否獲得原諒

市場逼近崩盤，總理罕見用中文發聲，一句“對不起”能否獲得原諒

百科密碼

2025-12-29 15:20:24

美國告知中國，選好了主戰場！新的交鋒即將開始，中方把話說透

美國告知中國，選好了主戰場！新的交鋒即將開始，中方把話說透

滄海旅行家

2025-12-30 18:18:38

交流結束，蔣萬安閃電離滬，上飛機前通告全島，臺當局捅了馬蜂窩

交流結束，蔣萬安閃電離滬，上飛機前通告全島，臺當局捅了馬蜂窩

科普100克克

2025-12-30 18:08:15

挑釁原配、“睡”遍京圈，定居美國7年的徐靜蕾，私生活太狂野了

挑釁原配、“睡”遍京圈，定居美國7年的徐靜蕾，私生活太狂野了

時光在作祟

2025-12-27 18:37:45

大家盼的終究來了！大陸攔截向臺灣運載“海馬斯”火箭長榮貨輪

大家盼的終究來了！大陸攔截向臺灣運載“海馬斯”火箭長榮貨輪

頭條爆料007

2025-12-30 17:24:39

毛主席逝世，將軍悲痛欲絕，稱“想回到他身邊”，隨后，安然而逝

毛主席逝世，將軍悲痛欲絕，稱“想回到他身邊”，隨后，安然而逝

覃仕勇說史

2025-12-30 17:41:24

養老金核定表核對指南：江蘇退休人別漏看3處關鍵，錯1項可能少領

養老金核定表核對指南：江蘇退休人別漏看3處關鍵，錯1項可能少領

金哥說新能源車

2025-12-30 10:44:31

血常規檢查中最怕這4項指標出現異常！提醒：大概率會影響壽命

血常規檢查中最怕這4項指標出現異常！提醒：大概率會影響壽命

健康之光

2025-12-30 10:13:22

內斗再開？國民黨中央委員選舉，朱立倫大獲成功，鄭麗文排名靠后

內斗再開？國民黨中央委員選舉，朱立倫大獲成功，鄭麗文排名靠后

策前論

2025-12-29 12:20:16

美司令曾警告：若大陸武力收臺，美軍將摧毀中方火箭軍和核武庫！

美司令曾警告：若大陸武力收臺，美軍將摧毀中方火箭軍和核武庫！

壹知眠羊

2025-12-21 07:15:19

曾被吹捧上天，如今卻淪為笑柄的6個坑人物品，大家別再買了！

曾被吹捧上天，如今卻淪為笑柄的6個坑人物品，大家別再買了！

室內設計師有料兒

2025-12-27 17:07:20

林澤昌任財政部黨組成員、副部長

林澤昌任財政部黨組成員、副部長

界面新聞

2025-12-30 17:56:39

大反轉，遼寧隊慘敗卻收兩個好消息，超級巨星有望加入中國男籃

大反轉，遼寧隊慘敗卻收兩個好消息，超級巨星有望加入中國男籃

宗介說體育

2025-12-30 17:41:58

新疆維吾爾自治區烏魯木齊市委原常委巴哈特·何德爾拜接受審查調查

新疆維吾爾自治區烏魯木齊市委原常委巴哈特·何德爾拜接受審查調查

界面新聞

2025-12-30 15:01:18

35歲成都街頭崩潰：那個被“精致窮”毀掉的姑娘，給所有人警示！

35歲成都街頭崩潰：那個被“精致窮”毀掉的姑娘，給所有人警示！

涵豆說娛

2025-12-30 14:06:28

2026年1月1日起，一批新規將施行！

2026年1月1日起，一批新規將施行！

新華社

2025-12-30 16:50:07

追蹤人工智能動態

11946文章數 176352關注度

往期回顧全部

科技要聞

估值150億的智元，開始批量"制造"小獨角獸

頭條要聞

副局長婚內與異性開房前妻向紀委舉報其違規接受宴請

頭條要聞

副局長婚內與異性開房前妻向紀委舉報其違規接受宴請

體育要聞

這個59歲的胖子，還在表演“蝎子擺尾”

娛樂要聞

林俊杰女友被扒父親涉經濟案卷款13億?

財經要聞

朱光耀：美關稅政策正使WTO名存實亡

汽車要聞

標配華為乾崑ADS 4 Pro 華境S明年上半年上市

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

時尚

本地

數碼

家居

軍事航空

她們冬天這樣穿，真的很美！

本地新聞

即將過去的2025年，對重慶的影響竟然如此深遠

數碼要聞

海備思推出創意M.2移動硬盤盒，軟盤/文件夾造型

家居要聞

當歸之宅三胎圓滿居所

溫暖色調大空間不冷清
溫潤質感打造干凈空間
歐式風格純粹優雅氣質

軍事要聞

福建海警艦艇與臺海巡船對峙航行

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：黑人又大又粗免费视频| 成人乱人伦精品小说| 国产八区| 愛爱视频在线3| 老熟女网站| 久久人人97超碰国产精品| 亚洲中文字幕无码一区日日添| 蜜桃AV鲁一鲁| 亚洲综合无码明星蕉在线视频| 狠狠色噜噜狠狠狠狠色综合网 | 差差差很依人| 亚洲一区二区三区18禁| 国产精品va在线观看无码不卡| 中文字幕乱妇无码AV在线| 亚洲综合色婷婷中文字幕| 九九综合va免费看| 中国精品18videosex性中国| 无码爆乳护士让我爽| 久久久久国产精品熟女影院| 河北省| 于田县| 南丹县| 云阳县| 酒泉市| 色图综合网| 武隆县| 久久人妻在线| 91免费在线播放| 国产xxxxxx| 伊人五月综合| 巫山县| 色综合偷拍| 亚洲综合成人精品| 精品流白浆| 撕开奶罩揉吮奶头高潮av| 免费无码毛片一区二三区| 日韩欧美2| 国产精品无码专区| 经典国产乱子伦精品视频| 内射后入在线观看一区| 茄子av|

<pre id="onjlp"><menuitem id="onjlp"><thead id="onjlp"></thead></menuitem></pre>

<pre id="onjlp"></pre>

<menuitem id="onjlp"><strike id="onjlp"></strike></menuitem>

<meter id="onjlp"><td id="onjlp"></td></meter>

<dfn id="onjlp"></dfn>