<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      擴散模型成最快深度思考!告別自回歸每秒1009個tokens

      0
      分享至

      首個會深度思考的擴散模型來了!

      拋棄自回歸范式,一舉成為世界上生成速度最快的模型。

      你瞅瞅,對比之下傳統自回歸的“打字機模式”(按順序一個個token往外吐)是不是就有點像烏龜了:



      實際測評顯示,這款名為Mercury 2的擴散推理LLM在英偉達GPU上可實現1009個tokens/s

      這個速度整整比GPT-5(mini)和Claude-4.5(haiku)這些傳統模型快了5倍。



      消息一出,英偉達第一時間跑來祝賀了(當然也可能是因為它投了Mercury 2背后的公司):



      一眾網友也紛紛坐不住,畢竟最近很火的“龍蝦們”也少不了對速度的極限追求:



      還有人已經開始懷念自回歸曾經的風光了(doge)。



      so,Mercury 2是誰?它又是如何突破速度瓶頸的呢?

      不止是快,還穩

      原理其實很簡單。

      前面已經說了,傳統自回歸就像打字機一樣,一次只能處理一個token,且必須按照從左到右的順序。

      但擴散模型Mercury 2的工作方式更像一位編輯——

      你不是在看它打字,而是看它拿到一份草稿后,立刻拿著紅筆在整頁紙上同時圈改。

      換言之,一次生成答案草稿再整體編輯。

      這種“并行優化”機制,使得Mercury 2不需要等待前一個字的結果就能生成下一個字,因此響應速度極快,延遲不再與輸出長度成正比。

      最終,Mercury 2能將生成速度提升5倍以上,且速度曲線截然不同

      瞅瞅,在第三方測評中,其輸出速度可謂一騎絕塵。



      和市面主流的頂尖模型比,速度也是獨一檔的存在。



      而且不止是快,它在性能、價格方面都具有一定優勢。

      延遲低至1.7s的情況下,在GPQA(科學問答)、LCB(編程)、AIME(數學)等多個基準測試中,Mercury 2的得分普遍高于或持平于那些速度較慢的“小型/輕量級”模型(如GPT-5 Nano, Claude 4.5 Haiku)。

      甚至在AIME上的得分超過了公認的“性能怪獸”Gemini 3 Flash(推理版) 。

      這說明Mercury 2在保持極高速度的同時,并不以犧牲智商為代價。



      它目前支持128K上下文,輸入價格為每百萬token 0.25美元(約合人民幣1.7元),輸出價格為每百萬token 0.75美元(約合人民幣5.2元)。

      綜合速度與價格,Mercury 2也保持了較高性價比。



      官方表示,Mercury 2的這種速度優勢改變了推理。

      • 如今,更高的智能意味著更多的test-time計算——更長的鏈、更多的樣本、更多的重試,而這直接以延遲和成本為代價。基于擴散的推理能夠在實時延遲預算內實現推理級別的質量。

      背后公司一開始就押注擴散模型

      最后介紹一下Mercury 2背后的公司及團隊。

      它是由Inception Labs這家成立于2024年的硅谷初創公司推出的。

      從一開始這家公司就力押擴散模型,其核心使命為——

      用全新的、基于擴散/diffusion的生成機制替代傳統的自回歸Transformer模型,從根本上突破速度與成本瓶頸。

      他們認為,傳統自回歸模型的缺陷不言自明——延遲和成本會隨著token數量的增加而增加。

      而擴散模型采用由粗到精的生成過程。它并非逐個提交數據,而是通過少量步驟并行迭代地細化輸出。這使得在生成過程中可以進行修改,并帶來截然不同的速度-成本曲線。一言以蔽之:

      • 人工智能不應該像單向打字機那樣運作,而應該更像一個編輯。

      基于此,他們開始在Mercury系列中踐行這一理念。

      2025年2月,發布全球首個基于擴散模型的商業級語言模型——初代Mercury,一開始就把生成速度拉到傳統的5倍以上,而且同一時間還推出編程助手Mercury Coder。

      一年之后,升級版Mercury 2問世,在推理和多智能體日益進入主流視線的今天,帶來了更多可能。



      事實上,早在2019年,這家公司的聯創兼CEO Stefano Ermon就開始投身擴散模型的研究了。

      時任斯坦福大學計算機科學教授的Stefano Ermon,很早就思忖著將擴散模型應用于內容生成。

      當時主流的圖像生成模型還在使用GAN(生成對抗網絡),但他和團隊認為結果“不夠好”,于是開始嘗試應用Diffusion。

      而在看到Diffusion的效果不錯后(后來Midjourney、DALL-E等都是用這種方法),他們開始將研究目光轉向文本和代碼生成。

      • 圖像由連續的像素構成,而文本由離散的token構成。之前成功的擴散模型理論(如去噪得分匹配)是建立在連續空間上的,無法直接遷移到文本。

      于是在2023年,他和團隊發表了一篇關鍵性論文《Discrete Diffusion Modeling by Estimating the Ratios of the Data Distribution》,里面介紹了一種名為Score Entropy Discrete Diffusion models(SEDD)的模型。

      該模型創新性提出了“分數熵”(score entropy)這一全新損失函數,它巧妙地將連續空間的分數匹配理論擴展到了離散數據領域。

      這使得擴散模型能夠像理解圖像一樣,去理解和生成語言。



      論文結果表明,SEDD的表現明顯優于當時已有的語言模型,困惑度比未退火(未使用“動態調整溫度”這個優化技巧)的GPT-2好6-8倍。

      (注:后來這篇論文還獲得了ICML 2024最佳論文獎)

      見此,Stefano Ermon決定通過創業將技術價值放大。

      于是在2024年夏天,他邀請美國加利福尼亞大學洛杉磯分校教授Aditya Grover(左)和美國康奈爾大學教授Volodymyr Kuleshov(右)加入Inception Labs。



      去年11月,這家公司還宣布獲得了5000萬美元融資,而且投資陣容相當豪華。

      除了NVentures(英偉達風投部門)、M12(微軟旗下風險基金)、Menlo Ventures (領投方、知名長期風投機構)等明星機構,還不乏吳恩達、卡帕西這些AI大佬。

      可以說,堅持走擴散模型路子的Inception Labs始終穩扎穩打并獲得市場支持。

      最后順便一提,Mercury 2目前暫無開源計劃,不過其API全面兼容OpenAI標準。

      感興趣的朋友也可親自上手一試了。

      體驗地址:
      https://chat.inceptionlabs.ai/

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      德國總理默茨率團訪華,完整代表團名單公布,最新調查報告顯示:93%的在華德企仍計劃維持或擴大合作

      德國總理默茨率團訪華,完整代表團名單公布,最新調查報告顯示:93%的在華德企仍計劃維持或擴大合作

      大風新聞
      2026-02-26 10:25:10
      一場高速堵車,戳穿了3700萬新能源車主“謊言”,差距一目了然

      一場高速堵車,戳穿了3700萬新能源車主“謊言”,差距一目了然

      芭比衣櫥
      2026-02-24 09:41:49
      一波又起,一本菲卡球迷在伯納烏用香蕉“喂食”維尼修斯引爭議

      一波又起,一本菲卡球迷在伯納烏用香蕉“喂食”維尼修斯引爭議

      懂球帝
      2026-02-26 10:06:08
      歐冠附加賽皇馬2-1險勝本菲卡,賽后不得不承認的三大事實!

      歐冠附加賽皇馬2-1險勝本菲卡,賽后不得不承認的三大事實!

      田先生籃球
      2026-02-26 09:43:43
      減持字節暴賺!估值從200億美元到5500億美元,9年贏麻了

      減持字節暴賺!估值從200億美元到5500億美元,9年贏麻了

      財視傳播
      2026-02-26 10:17:08
      節后門診爆滿,這種“神器”火了!有人用后嘔吐、厭食,醫生緊急提醒

      節后門診爆滿,這種“神器”火了!有人用后嘔吐、厭食,醫生緊急提醒

      環球網資訊
      2026-02-26 07:26:21
      墨西哥毒販向國家宣戰,10萬武裝分子決戰政府軍

      墨西哥毒販向國家宣戰,10萬武裝分子決戰政府軍

      史政先鋒
      2026-02-23 21:59:00
      同家族近20人在路上祭祖遇車禍,致2死多傷后又遇理賠難,多方回應

      同家族近20人在路上祭祖遇車禍,致2死多傷后又遇理賠難,多方回應

      大風新聞
      2026-02-25 17:00:14
      為啥谷愛凌的神秘父親總被傳是谷歌5號員工,有人心思毒硬貼金

      為啥谷愛凌的神秘父親總被傳是谷歌5號員工,有人心思毒硬貼金

      安寧007
      2026-02-25 13:36:55
      果然不簡單:中國摁住日本后,又讓美國見識了北京的“陽謀”

      果然不簡單:中國摁住日本后,又讓美國見識了北京的“陽謀”

      花小貓的美食日常
      2026-02-26 06:51:35
      打人時有多狂,求和解時就有多慫!看完太解氣!

      打人時有多狂,求和解時就有多慫!看完太解氣!

      風起見你
      2026-02-25 18:54:43
      苦命水均益:76歲智殘哥哥至今未婚,他養了哥哥一輩子不離不棄

      苦命水均益:76歲智殘哥哥至今未婚,他養了哥哥一輩子不離不棄

      娛說瑜悅
      2026-02-25 20:56:02
      “我就是她取精生子的工具”清華學霸哭訴,撕開了女富豪的遮羞布

      “我就是她取精生子的工具”清華學霸哭訴,撕開了女富豪的遮羞布

      百態中的情感起伏
      2026-02-23 12:25:50
      女子在胖東來1小時消費近15萬,稱相信品質,排隊也要來買黃金,1分鐘試戴加付款,極速購買

      女子在胖東來1小時消費近15萬,稱相信品質,排隊也要來買黃金,1分鐘試戴加付款,極速購買

      觀威海
      2026-02-26 10:54:09
      震驚!網傳河南一老人93歲去世,此前自殺3次,起因不想住女兒家

      震驚!網傳河南一老人93歲去世,此前自殺3次,起因不想住女兒家

      火山詩話
      2026-02-25 17:10:36
      你經歷過哪些殺人誅心的事?網友:所以沒有婆婆拆散不了的家

      你經歷過哪些殺人誅心的事?網友:所以沒有婆婆拆散不了的家

      帶你感受人間冷暖
      2026-02-11 10:54:58
      小馬寶出生三天眼睛睜開,嘴巴好大,特別像馬筱梅,引發網友熱議

      小馬寶出生三天眼睛睜開,嘴巴好大,特別像馬筱梅,引發網友熱議

      魔都姐姐雜談
      2026-02-25 19:10:29
      華為正式官宣:2月26日,新機全球發布!

      華為正式官宣:2月26日,新機全球發布!

      科技堡壘
      2026-02-25 13:18:13
      氣質軟綿綿別演大俠,《鏢人》謝霆鋒吳京告訴你啥才叫尊重觀眾!

      氣質軟綿綿別演大俠,《鏢人》謝霆鋒吳京告訴你啥才叫尊重觀眾!

      娛樂圈筆娛君
      2026-02-24 18:16:13
      突發!2026年全國第一巨額搶劫案在江蘇發生了,197萬,疑犯已捕

      突發!2026年全國第一巨額搶劫案在江蘇發生了,197萬,疑犯已捕

      原廣工業
      2026-02-26 07:57:32
      2026-02-26 12:56:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      12204文章數 176394關注度
      往期回顧 全部

      科技要聞

      單季營收681億凈利429億!英偉達再次炸裂

      頭條要聞

      特朗普自詡開啟美國"黃金時代" 遭美媒集體"打臉"

      頭條要聞

      特朗普自詡開啟美國"黃金時代" 遭美媒集體"打臉"

      體育要聞

      從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

      娛樂要聞

      尼格買提撒貝寧滑雪被偶遇 17年老友情

      財經要聞

      短劇市場風云突變!有人投百萬賠得精光

      汽車要聞

      第五代宏光MINIEV煥新 四門玩趣代步車來襲

      態度原創

      時尚
      藝術
      手機
      游戲
      軍事航空

      倫敦時裝周|2026秋冬流行趨勢早知道

      藝術要聞

      2025年百家金陵畫展 | 油畫作品選刊

      手機要聞

      三星Galaxy S26 Ultra手機支持2400萬像素直出

      新品節DEMO試玩報告

      軍事要聞

      美政府給新伊核協議設限內容遭披露

      無障礙瀏覽 進入關懷版