<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<blockquote id="wayq6"></blockquote>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

擴散模型成最快深度思考！告別自回歸每秒1009個tokens

2026-02-26 10:01:39　來源: 量子位

北京舉報

0

分享至

首個會深度思考的擴散模型來了！

拋棄自回歸范式，一舉成為世界上生成速度最快的模型。

你瞅瞅，對比之下傳統自回歸的“打字機模式”（按順序一個個token往外吐）是不是就有點像烏龜了：

實際測評顯示，這款名為Mercury 2的擴散推理LLM在英偉達GPU上可實現1009個tokens/s。

這個速度整整比GPT-5（mini）和Claude-4.5（haiku）這些傳統模型快了5倍。

消息一出，英偉達第一時間跑來祝賀了（當然也可能是因為它投了Mercury 2背后的公司）：

一眾網友也紛紛坐不住，畢竟最近很火的“龍蝦們”也少不了對速度的極限追求：

還有人已經開始懷念自回歸曾經的風光了（doge）。

so，Mercury 2是誰？它又是如何突破速度瓶頸的呢？

不止是快，還穩

原理其實很簡單。

前面已經說了，傳統自回歸就像打字機一樣，一次只能處理一個token，且必須按照從左到右的順序。

但擴散模型Mercury 2的工作方式更像一位編輯——

你不是在看它打字，而是看它拿到一份草稿后，立刻拿著紅筆在整頁紙上同時圈改。

換言之，一次生成答案草稿再整體編輯。

這種“并行優化”機制，使得Mercury 2不需要等待前一個字的結果就能生成下一個字，因此響應速度極快，延遲不再與輸出長度成正比。

最終，Mercury 2能將生成速度提升5倍以上，且速度曲線截然不同。

瞅瞅，在第三方測評中，其輸出速度可謂一騎絕塵。

和市面主流的頂尖模型比，速度也是獨一檔的存在。

而且不止是快，它在性能、價格方面都具有一定優勢。

延遲低至1.7s的情況下，在GPQA（科學問答）、LCB（編程）、AIME（數學）等多個基準測試中，Mercury 2的得分普遍高于或持平于那些速度較慢的“小型/輕量級”模型（如GPT-5 Nano, Claude 4.5 Haiku）。

甚至在AIME上的得分超過了公認的“性能怪獸”Gemini 3 Flash（推理版）。

這說明Mercury 2在保持極高速度的同時，并不以犧牲智商為代價。

它目前支持128K上下文，輸入價格為每百萬token 0.25美元（約合人民幣1.7元），輸出價格為每百萬token 0.75美元（約合人民幣5.2元）。

綜合速度與價格，Mercury 2也保持了較高性價比。

官方表示，Mercury 2的這種速度優勢改變了推理。

如今，更高的智能意味著更多的test-time計算——更長的鏈、更多的樣本、更多的重試，而這直接以延遲和成本為代價。基于擴散的推理能夠在實時延遲預算內實現推理級別的質量。

背后公司一開始就押注擴散模型

最后介紹一下Mercury 2背后的公司及團隊。

它是由Inception Labs這家成立于2024年的硅谷初創公司推出的。

從一開始這家公司就力押擴散模型，其核心使命為——

用全新的、基于擴散/diffusion的生成機制替代傳統的自回歸Transformer模型，從根本上突破速度與成本瓶頸。

他們認為，傳統自回歸模型的缺陷不言自明——延遲和成本會隨著token數量的增加而增加。

而擴散模型采用由粗到精的生成過程。它并非逐個提交數據，而是通過少量步驟并行迭代地細化輸出。這使得在生成過程中可以進行修改，并帶來截然不同的速度-成本曲線。一言以蔽之：

人工智能不應該像單向打字機那樣運作，而應該更像一個編輯。

基于此，他們開始在Mercury系列中踐行這一理念。

2025年2月，發布全球首個基于擴散模型的商業級語言模型——初代Mercury，一開始就把生成速度拉到傳統的5倍以上，而且同一時間還推出編程助手Mercury Coder。

一年之后，升級版Mercury 2問世，在推理和多智能體日益進入主流視線的今天，帶來了更多可能。

事實上，早在2019年，這家公司的聯創兼CEO Stefano Ermon就開始投身擴散模型的研究了。

時任斯坦福大學計算機科學教授的Stefano Ermon，很早就思忖著將擴散模型應用于內容生成。

當時主流的圖像生成模型還在使用GAN（生成對抗網絡），但他和團隊認為結果“不夠好”，于是開始嘗試應用Diffusion。

而在看到Diffusion的效果不錯后（后來Midjourney、DALL-E等都是用這種方法），他們開始將研究目光轉向文本和代碼生成。

圖像由連續的像素構成，而文本由離散的token構成。之前成功的擴散模型理論（如去噪得分匹配）是建立在連續空間上的，無法直接遷移到文本。

于是在2023年，他和團隊發表了一篇關鍵性論文《Discrete Diffusion Modeling by Estimating the Ratios of the Data Distribution》，里面介紹了一種名為Score Entropy Discrete Diffusion models（SEDD）的模型。

該模型創新性提出了“分數熵”（score entropy）這一全新損失函數，它巧妙地將連續空間的分數匹配理論擴展到了離散數據領域。

這使得擴散模型能夠像理解圖像一樣，去理解和生成語言。

論文結果表明，SEDD的表現明顯優于當時已有的語言模型，困惑度比未退火（未使用“動態調整溫度”這個優化技巧）的GPT-2好6-8倍。

（注：后來這篇論文還獲得了ICML 2024最佳論文獎）

見此，Stefano Ermon決定通過創業將技術價值放大。

于是在2024年夏天，他邀請美國加利福尼亞大學洛杉磯分校教授Aditya Grover（左）和美國康奈爾大學教授Volodymyr Kuleshov（右）加入Inception Labs。

去年11月，這家公司還宣布獲得了5000萬美元融資，而且投資陣容相當豪華。

除了NVentures（英偉達風投部門）、M12（微軟旗下風險基金）、Menlo Ventures （領投方、知名長期風投機構）等明星機構，還不乏吳恩達、卡帕西這些AI大佬。

可以說，堅持走擴散模型路子的Inception Labs始終穩扎穩打并獲得市場支持。

最后順便一提，Mercury 2目前暫無開源計劃，不過其API全面兼容OpenAI標準。

感興趣的朋友也可親自上手一試了。

體驗地址：
https://chat.inceptionlabs.ai/

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

瑞士工程科技公司Emissium研發電力二氧化碳排放因子數據軟件，提升企業能源交易管理能力

鈦媒體APP 2026-02-25 17:16:05
0 跟貼 0
NBA速度最快的八大球星，第一名你可能都不認識

十三哥侃大山 2026-02-23 00:24:50
96 跟貼 96

訓練獎勵太稀疏？港中文聯合美團給Agent加上「過程分」

機器之心Pro 2026-02-25 17:27:26
0 跟貼 0

消費級顯卡可跑！剛剛，阿里Qwen3.5又開源3款新模型

機器之心Pro 2026-02-25 17:09:48
16 跟貼 16
AI記住失敗經驗：微軟提出Re-TRAC框架，4B性能SOTA，30B超越358B

機器之心Pro 2026-02-25 17:33:51
0 跟貼 0

QVGen讓「超低比特視頻生成量化」真正可用！

機器之心Pro 2026-02-25 18:07:24
0 跟貼 0

土耳其五代機完成迭代！三架原型機同時亮相，設計更加完善

精彩不容錯過 2026-02-23 18:54:45
40 跟貼 40
近百萬元存款被悄悄轉走！上海獨居老太毫無察覺，還說“我有兩套房，你可以搬來同住”

瀟湘晨報 2026-02-25 16:39:13
6141 跟貼 6141

具身大腦項目，扎堆晉升獨角獸！

財聯社 2026-02-25 19:32:04
0 跟貼 0
精準推理排除炸，穩穩贏3炮！！！

抖球 2026-02-26 01:41:46
0 跟貼 0
馬年4大頂流模型會師阿里云Coding Plan開工！Token量大管飽

量子位 2026-02-25 23:10:53
3 跟貼 3
讓擴散模型「可解釋」不再降質，開啟圖片編輯新思路

機器之心Pro 2025-12-16 14:37:44
0 跟貼 0
又是一場完美的推理,女王大帆的傷不要緊,幾天就能好,體質老好了

阿于總閑不住 2026-02-25 16:05:10
0 跟貼 0
這就是速度，又快又平又標準，他敢稱第二沒人稱第一！

生活就是如此 2026-02-25 10:10:46
0 跟貼 0
英特爾再戰AI，聯手AI芯片初創押注推理市場

DeepTech深科技 2026-02-25 17:28:43
2 跟貼 2
日本速度到底有多牛，事實顛覆了想象，實在是太慢了！

搞笑笑搞笑 2026-02-25 16:21:41
0 跟貼 0
別再犯這5個避震設置錯誤了——來自世界杯技師的5條建議

中國自行車在線 2026-02-26 06:05:07
1 跟貼 1
趙心童露頭就秒的刀片薄球！極限準度彈無虛發，對手屬實防不勝防

心開動漫鑫鑫 2026-02-24 02:24:52
46 跟貼 46
日本計劃部署導彈部隊距臺灣僅110公里中方強硬表態

環球網資訊 2026-02-26 06:54:33
3894 跟貼 3894
天壇50臺宇樹機器人表演，郭正亮贊其迭代神速！

許里xurry 2026-02-26 10:28:12
0 跟貼 0
連環殺人×燒腦反轉! 這本推理看到我血壓飆升

賣書狂魔熊貓君 2026-02-25 18:50:49
0 跟貼 0
鄰里極限拉扯！這劇第一集就藏著 800 個心眼子

開心奇異果 2026-02-24 10:39:22
1 跟貼 1
施工現場磚塊運輸過程，看著有點像模型，竟還有點好玩！

幽默小火山 2026-02-25 11:39:53
1 跟貼 1
希金斯目瞪口呆！趙心童極限操作引爆全場

夜叔 2026-02-24 05:29:24
37 跟貼 37
MiniMax來承包你的桌面了-2

機器之心Pro 2026-01-20 20:18:52
0 跟貼 0
心靈預言術你知道其中的原理嗎

宮羽魔術 2026-02-23 16:21:40
36 跟貼 36
7B擴散語言模型單樣例1000+ tokens/s！

機器之心Pro 2025-12-31 16:26:20
0 跟貼 0
用TRAE Skills構建你的10倍效能工具箱-3

機器之心Pro 2026-01-22 14:24:16
0 跟貼 0
阿里云推出低價AI編程套餐，集成四大頂級開源模型

華爾街見聞官方 2026-02-26 06:30:00
15 跟貼 15
平時穿的抽繩運動褲，抽繩是這樣放進去的，沒看懂是什么原理

笑場速遞 2026-02-25 09:02:03
1 跟貼 1
罕見場面！我國一款隱秘武器出口交付，智能對空榴彈首次精準擊中

一飲山河 2026-02-24 16:23:14
0 跟貼 0
41位世界冠軍陪跑！只為讓一個人突破人類極限

愛笑無厘頭 2026-02-24 14:43:38
1 跟貼 1
斯坦福氛圍編程課火了！用AI搞定軟件開發全流程

量子位 2026-02-25 09:55:05
0 跟貼 0
什么是汽車空氣動力學，看完就知道了，汽車曲線的影響效果！

笑場大魔王 2026-02-24 16:06:29
1 跟貼 1
智能鎖就是這么智能

阿嬌侃劇 2026-02-25 09:04:02
1 跟貼 1
金字塔碳14檢測后，真相混亂到讓學界集體“瘋魔”

今墨緣 2026-02-26 02:01:49
0 跟貼 0
300多只東北虎“輕斷食”？景區：每天斷食1個園，司機會帶游客找可投喂區

封面新聞 2026-02-23 16:29:03
1660 跟貼 1660
小鵬第二代VLA將于3月2日發布大眾成首發客戶

太平洋汽車 2026-02-26 12:02:34
0 跟貼 0
插秧機的原理，原來是這樣的！

看你像個寶 2026-02-22 19:21:32
1 跟貼 1
中華人民共和國和德意志聯邦共和國聯合新聞聲明

新華社 2026-02-25 21:46:25
637 跟貼 637

德國總理默茨率團訪華，完整代表團名單公布，最新調查報告顯示：93%的在華德企仍計劃維持或擴大合作

德國總理默茨率團訪華，完整代表團名單公布，最新調查報告顯示：93%的在華德企仍計劃維持或擴大合作

大風新聞

2026-02-26 10:25:10

一場高速堵車，戳穿了3700萬新能源車主“謊言”，差距一目了然

一場高速堵車，戳穿了3700萬新能源車主“謊言”，差距一目了然

芭比衣櫥

2026-02-24 09:41:49

一波又起，一本菲卡球迷在伯納烏用香蕉“喂食”維尼修斯引爭議

一波又起，一本菲卡球迷在伯納烏用香蕉“喂食”維尼修斯引爭議

懂球帝

2026-02-26 10:06:08

歐冠附加賽皇馬2-1險勝本菲卡，賽后不得不承認的三大事實！

歐冠附加賽皇馬2-1險勝本菲卡，賽后不得不承認的三大事實！

田先生籃球

2026-02-26 09:43:43

減持字節暴賺！估值從200億美元到5500億美元，9年贏麻了

減持字節暴賺！估值從200億美元到5500億美元，9年贏麻了

財視傳播

2026-02-26 10:17:08

節后門診爆滿，這種“神器”火了！有人用后嘔吐、厭食，醫生緊急提醒

節后門診爆滿，這種“神器”火了！有人用后嘔吐、厭食，醫生緊急提醒

環球網資訊

2026-02-26 07:26:21

墨西哥毒販向國家宣戰，10萬武裝分子決戰政府軍

墨西哥毒販向國家宣戰，10萬武裝分子決戰政府軍

史政先鋒

2026-02-23 21:59:00

同家族近20人在路上祭祖遇車禍，致2死多傷后又遇理賠難，多方回應

同家族近20人在路上祭祖遇車禍，致2死多傷后又遇理賠難，多方回應

大風新聞

2026-02-25 17:00:14

為啥谷愛凌的神秘父親總被傳是谷歌5號員工，有人心思毒硬貼金

為啥谷愛凌的神秘父親總被傳是谷歌5號員工，有人心思毒硬貼金

安寧007

2026-02-25 13:36:55

果然不簡單：中國摁住日本后，又讓美國見識了北京的“陽謀”

果然不簡單：中國摁住日本后，又讓美國見識了北京的“陽謀”

花小貓的美食日常

2026-02-26 06:51:35

打人時有多狂，求和解時就有多慫！看完太解氣！

打人時有多狂，求和解時就有多慫！看完太解氣！

風起見你

2026-02-25 18:54:43

苦命水均益：76歲智殘哥哥至今未婚，他養了哥哥一輩子不離不棄

苦命水均益：76歲智殘哥哥至今未婚，他養了哥哥一輩子不離不棄

娛說瑜悅

2026-02-25 20:56:02

“我就是她取精生子的工具”清華學霸哭訴，撕開了女富豪的遮羞布

“我就是她取精生子的工具”清華學霸哭訴，撕開了女富豪的遮羞布

百態中的情感起伏

2026-02-23 12:25:50

女子在胖東來1小時消費近15萬，稱相信品質，排隊也要來買黃金，1分鐘試戴加付款，極速購買

女子在胖東來1小時消費近15萬，稱相信品質，排隊也要來買黃金，1分鐘試戴加付款，極速購買

觀威海

2026-02-26 10:54:09

震驚！網傳河南一老人93歲去世，此前自殺3次，起因不想住女兒家

震驚！網傳河南一老人93歲去世，此前自殺3次，起因不想住女兒家

火山詩話

2026-02-25 17:10:36

你經歷過哪些殺人誅心的事？網友：所以沒有婆婆拆散不了的家

你經歷過哪些殺人誅心的事？網友：所以沒有婆婆拆散不了的家

帶你感受人間冷暖

2026-02-11 10:54:58

小馬寶出生三天眼睛睜開，嘴巴好大，特別像馬筱梅，引發網友熱議

小馬寶出生三天眼睛睜開，嘴巴好大，特別像馬筱梅，引發網友熱議

魔都姐姐雜談

2026-02-25 19:10:29

華為正式官宣：2月26日，新機全球發布！

華為正式官宣：2月26日，新機全球發布！

科技堡壘

2026-02-25 13:18:13

氣質軟綿綿別演大俠，《鏢人》謝霆鋒吳京告訴你啥才叫尊重觀眾！

氣質軟綿綿別演大俠，《鏢人》謝霆鋒吳京告訴你啥才叫尊重觀眾！

娛樂圈筆娛君

2026-02-24 18:16:13

突發！2026年全國第一巨額搶劫案在江蘇發生了，197萬，疑犯已捕

突發！2026年全國第一巨額搶劫案在江蘇發生了，197萬，疑犯已捕

原廣工業

2026-02-26 07:57:32

追蹤人工智能動態

12204文章數 176394關注度

往期回顧全部

科技要聞

單季營收681億凈利429億！英偉達再次炸裂

頭條要聞

特朗普自詡開啟美國"黃金時代" 遭美媒集體"打臉"

頭條要聞

特朗普自詡開啟美國"黃金時代" 遭美媒集體"打臉"

體育要聞

從排球少女到冰壺女神，她在米蘭冬奧練出6塊腹肌

娛樂要聞

尼格買提撒貝寧滑雪被偶遇 17年老友情

財經要聞

短劇市場風云突變！有人投百萬賠得精光

汽車要聞

第五代宏光MINIEV煥新四門玩趣代步車來襲

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

時尚

藝術

手機

游戲

軍事航空

倫敦時裝周｜2026秋冬流行趨勢早知道

藝術要聞

2025年百家金陵畫展 | 油畫作品選刊

手機要聞

三星Galaxy S26 Ultra手機支持2400萬像素直出

新品節DEMO試玩報告

軍事要聞

美政府給新伊核協議設限內容遭披露

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<ruby id="hezxj"><dfn id="hezxj"></dfn></ruby>