<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      推理成本打到1元/百萬token,浪潮撬動Agent規模化“最后一公里”

      0
      分享至

      允中 發自 凹非寺
      量子位 | 公眾號 QbitAI

      當前全球AI產業已從模型性能競賽邁入智能體規模化落地的“生死競速”階段,“降本”不再是可選優化項,而是決定AI企業能否盈利、行業能否突破的核心命脈。

      在此大背景下,浪潮信息推出元腦HC1000超擴展AI服務器,將推理成本首次擊穿至1元/每百萬token

      這一突破不僅有望打通智能體產業化落地“最后一公里”的成本障礙,更將重塑AI產業競爭的底層邏輯。

      浪潮信息首席AI戰略官劉軍強調:

      • 當前1元/每百萬token的成本突破僅是階段性勝利,面對未來token消耗量指數級增長、復雜任務token需求激增數十倍的必然趨勢,現有成本水平仍難支撐AI的普惠落地。

      未來,AI要真正成為如同 “水電煤” 般的基礎資源,token成本必須在現有基礎上實現數量級跨越,成本能力將從“核心競爭力”進一步升級為“生存入場券”,直接決定AI企業在智能體時代的生死存亡。


      △浪潮信息首席AI戰略官劉軍

      智能體時代,token成本就是競爭力

      回顧互聯網發展史,基礎設施的“提速降費”是行業繁榮的重要基石。

      從撥號上網以Kb計費,到光纖入戶后百兆帶寬成為標配,再到4G/5G時代數據流量成本趨近于零——每一次通信成本的顯著降低,都推動了如視頻流媒體、移動支付等全新應用生態的爆發。

      當前的AI時代也處于相似的臨界點,當技術進步促使token單價下滑之后,企業得以大規模地將AI應用于更復雜、更耗能的場景,如從早期的簡短問答,到如今支持超長上下文、具備多步規劃與反思能力的智能體……

      這也導致單任務對token的需求已呈指數級增長。如果token成本下降的速度跟不上消耗量的指數增長,企業將面臨更高的費用投入,這昭示著經濟學中著名的“杰文斯悖論”正在token經濟中完美重演。

      (杰文斯悖論是1865年經濟學家威廉·斯坦利·杰文斯提出的悖論:指當技術進步提高了效率,資源消耗不僅沒有減少,反而激增。例如,瓦特改良的蒸汽機讓煤炭燃燒更加高效,但結果卻是煤炭需求飆升。)

      來自多方的數據也有力佐證了token消耗量的指數級增長趨勢。

      • 火山引擎最新披露的數據顯示,截至今年12月,字節跳動旗下豆包大模型日均token使用量突破50萬億,較去年同期增長超過10倍,相比2024年5月剛推出時的日均調用量增長達417倍;
      • 谷歌在10月披露,其各平臺每月處理的token用量已達,相當于日均43.3萬億,而一年前月均僅為9.7萬億。


      △谷歌公布其token處理量變化

      當使用量達到“百萬億token/月”的量級時,哪怕每百萬token成本只下降1美元,也可能帶來每月1億美元的成本差異。

      對此,劉軍認為:

      • token成本就是競爭力,它直接決定了智能體的盈利能力。要讓AI真正進入規模化普惠階段,token成本必須在現有基礎上繼續實現數量級的下降。
      深挖token成本“暗箱”:架構不匹配是核心瓶頸

      當下,全球大模型競賽從“盲目堆算力”轉向“追求單位算力產出價值”的新階段。

      單位算力產出價值受到能源價格、硬件采購成本、算法優化、運營成本等多種因素的影響,但不可否認的是,現階段token成本80%以上依然來自算力支出。

      而阻礙成本下降的核心矛盾,在于推理負載與訓練負載截然不同,沿用舊架構會導致算力、顯存與網絡資源難以同時最優,造成嚴重的“高配低效”。

      一是算力利用率(MFU)的嚴重倒掛

      訓練階段MFU可達50%以上,但在推理階段,特別是對于追求低延遲的實時交互任務,由于token的自回歸解碼特性,在每一輪計算中,硬件必須加載全部的模型參數,卻只為了計算一個token的輸出,導致昂貴的GPU大部分時間在等待數據搬運,實際MFU往往僅為5%-10%。這種巨大的算力閑置是成本高企的結構性根源。

      二是“存儲墻”瓶頸在推理場景下被放大

      在大模型推理中,隨著上下文長度的增加,KV Cache呈指數級增長。這不僅占用了大量的顯存空間,還導致了由于訪存密集帶來的高功耗。

      這種存算分離不僅帶來數據遷移功耗和延遲,還必須配合使用價格高昂的HBM,已經成為阻礙token成本下降的重要瓶頸。

      三是網絡通信與橫向擴展代價愈發高昂

      當模型規模突破單機承載能力時,跨節點通信成為新瓶頸。傳統RoCE或InfiniBand網絡的延遲遠高于芯片內部的總線延遲,通信開銷可能占據總推理時間的30%以上,導致企業被迫通過堆砌更多資源來維持響應速度,推高了總擁有成本(TCO)。

      對此,劉軍指出,降低token成本的核心不是“把一臺機器做得更全”,而是圍繞目標重構系統

      把推理流程拆得更細,支持P/D分離、A/F分離、KV并行、細粒度專家拆分等計算策略,讓不同計算模塊在不同卡上按需配置并發,把每張卡的負載打滿,讓“卡時成本”更低、讓“卡時產出”更高。

      基于全新超擴展架構,元腦HC1000實現推理成本首次擊破1元/每百萬token

      當前主流大模型的token成本依然高昂。以輸出百萬token為例,Claude、Grok等模型的價格普遍在10-15美元,國內大模型雖然相對便宜,也多在10元以上。

      在天文數字級別的調用量下,如此高的token成本讓大規模商業化應用面臨嚴峻的ROI挑戰。

      因此,要打破成本僵局,必須從計算架構層面進行根本性重構,從而大幅提升單位算力的產出效率。


      △主流LLM的百萬token價格

      為此,浪潮信息推出元腦HC1000超擴展AI服務器

      該產品基于全新設計的全對稱DirectCom極速架構,采用無損超擴展設計,可高效聚合海量本土AI芯片,支持極大推理吞吐量,推理成本首次擊破1元/每百萬token,為智能體突破token成本瓶頸提供極致性能的創新算力系統。


      △元腦HC1000超擴展AI服務器

      對此,劉軍表示:

      • 我們看到原來的AI計算是瞄著大而全去建設的,五臟俱全,各種各樣的東西都在里面。但是當我們聚焦降低token成本這一核心目標之后,我們重新思考系統架構設計,找到系統瓶頸,重構出一個極簡設計的系統。

      元腦HC1000創新設計了DirectCom極速架構,每計算模組配置16顆AIPU,采用直達通信設計,解決傳統架構的協議轉換和帶寬爭搶問題,實現超低延遲;計算通信1:1均衡配比,實現全局無阻塞通信;全對稱的系統拓撲設計,可以支持靈活的PD分離、AF分離方案,按需配置計算實例,最大化資源利用率。


      △全對稱DirectCom極速架構

      同時,元腦HC1000支持超大規模無損擴展,DirectCom架構保障了計算和通信均衡,通過算網深度協同、全域無損技術實現推理性能1.75倍提升,并且通過對大模型的計算流程細分和模型結構解耦,實現計算負載的靈活按需配比,單卡MFU最高可提升5.7倍。


      △超大規模無損擴展

      此外,元腦HC1000通過自適應路由和智能擁塞控制算法,提供數據包級動態負載均衡,實現KV Cache傳輸和All to All通信流量的智能調度,將KV Cache傳輸對Prefill、Decode計算實例影響降低5-10倍。

      劉軍強調,當前“1元/每百萬token”還遠遠不夠,面對未來token消耗量的指數級增長,若要實現單token成本的持續、數量級下降,需要推動計算架構的根本性革新。

      這也要求整個AI產業的產品技術創新,要從當前的規模導向轉為效率導向,從根本上重新思考和設計AI計算系統,發展AI專用計算架構,探索開發大模型芯片,推動算法硬件化的專用計算架構創新,實現軟硬件深度優化,這將是未來的發展方向。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      新華社消息|外交部:任何在臺灣問題上越線挑釁的惡劣行徑必將遭到中方堅決回擊

      新華社消息|外交部:任何在臺灣問題上越線挑釁的惡劣行徑必將遭到中方堅決回擊

      新華社
      2025-12-29 20:13:04
      上海漫展驚現男子當眾排便,現場混亂引發圍觀。

      上海漫展驚現男子當眾排便,現場混亂引發圍觀。

      特約前排觀眾
      2025-12-30 00:10:05
      終于明白了!為啥農民寧愿斷繳醫保,也不愿再掏這400塊錢?

      終于明白了!為啥農民寧愿斷繳醫保,也不愿再掏這400塊錢?

      復轉這些年
      2025-12-25 23:30:29
      張杰謝娜跨年風波升級!張杰被吐槽贅婿,光《快本》就上了30次

      張杰謝娜跨年風波升級!張杰被吐槽贅婿,光《快本》就上了30次

      小咪侃娛圈
      2025-12-30 10:01:13
      突然一聲爆響!河南一地連夜通報:請廣大市民不必恐慌

      突然一聲爆響!河南一地連夜通報:請廣大市民不必恐慌

      都市快報橙柿互動
      2025-12-30 00:16:06
      就在今天,12月29日,火箭傳來了杜蘭特、謝潑德、史密斯新消息

      就在今天,12月29日,火箭傳來了杜蘭特、謝潑德、史密斯新消息

      林子說事
      2025-12-30 08:06:10
      閆學晶哭窮風波升級!本人火速關評投訴相關內容,兒子賬號設私密

      閆學晶哭窮風波升級!本人火速關評投訴相關內容,兒子賬號設私密

      萌神木木
      2025-12-29 12:13:26
      上海交大校友向母校捐贈1.3億元

      上海交大校友向母校捐贈1.3億元

      澎湃新聞
      2025-12-30 10:04:26
      同事猝死只換來1分鐘默哀!40歲架構師寧愿被裁,年薪百萬活得像機器

      同事猝死只換來1分鐘默哀!40歲架構師寧愿被裁,年薪百萬活得像機器

      新智元
      2025-12-28 09:09:34
      男子發現妻子胸口有可疑痕跡,到醫院檢查后,醫生:立即聯系警察

      男子發現妻子胸口有可疑痕跡,到醫院檢查后,醫生:立即聯系警察

      眼淚博物
      2025-08-07 16:47:38
      也談人民幣國際化:外匯管制下的悖論

      也談人民幣國際化:外匯管制下的悖論

      生命可以承受之輕
      2025-12-28 23:25:02
      一夜3大消息!小卡周最佳,快船連升5位,全明星首輪結果公布

      一夜3大消息!小卡周最佳,快船連升5位,全明星首輪結果公布

      體壇小李
      2025-12-30 08:47:54
      “亂港分子”周庭,棄保潛逃加拿大,揚言永不回國,如今怎么樣了

      “亂港分子”周庭,棄保潛逃加拿大,揚言永不回國,如今怎么樣了

      甜檸聊史
      2025-12-27 10:54:15
      1971年,劉思齊入獄后向毛主席求救,毛澤東最高指示:娃娃們無罪

      1971年,劉思齊入獄后向毛主席求救,毛澤東最高指示:娃娃們無罪

      鶴羽說個事
      2025-12-29 15:38:35
      家有這3個生肖,年底先窮后福!事業蒸蒸日上,鈔票用麻袋裝

      家有這3個生肖,年底先窮后福!事業蒸蒸日上,鈔票用麻袋裝

      人閒情事
      2025-12-30 09:31:42
      控衛歷史數據榜中,威少就是王一樣的存在

      控衛歷史數據榜中,威少就是王一樣的存在

      大眼瞄世界
      2025-12-29 22:31:33
      “兒子都腺樣體了,還吃烤腸呢?”一份糊弄早餐暴露家長的低認知

      “兒子都腺樣體了,還吃烤腸呢?”一份糊弄早餐暴露家長的低認知

      妍妍教育日記
      2025-12-26 17:18:26
      反轉了!成都4s店燃爆后續:官方再通報,辟謠糾紛原因,澄清真相

      反轉了!成都4s店燃爆后續:官方再通報,辟謠糾紛原因,澄清真相

      阿纂看事
      2025-12-29 16:22:14
      泰國防長不點名批評:有些國家聲稱保持中立,實際上在幫柬埔寨

      泰國防長不點名批評:有些國家聲稱保持中立,實際上在幫柬埔寨

      夢史
      2025-12-25 15:02:53
      260億都不要!毛阿敏帶女兒去美國生活后,大家才知她有多清醒

      260億都不要!毛阿敏帶女兒去美國生活后,大家才知她有多清醒

      徐徐道史
      2025-12-28 08:01:36
      2025-12-30 10:51:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      11942文章數 176346關注度
      往期回顧 全部

      科技要聞

      Manus官宣加入Meta,收購金額達數十億美金

      頭條要聞

      媒體:賴清德稱"大陸不敢越雷池" 第二天解放軍就演習

      頭條要聞

      媒體:賴清德稱"大陸不敢越雷池" 第二天解放軍就演習

      體育要聞

      這個59歲的胖子,還在表演“蝎子擺尾”

      娛樂要聞

      44歲林俊杰官宣戀情 帶23歲女友見家長

      財經要聞

      翁杰明:宏觀數據與居民微觀感受存在差距

      汽車要聞

      標配華為乾崑ADS 4 Pro 華境S明年上半年上市

      態度原創

      親子
      時尚
      藝術
      本地
      房產

      親子要聞

      有了女兒后,你才會發現父女的奇妙聯結

      碧姬·芭鐸,“穿衣自由”概念的祖師奶

      藝術要聞

      謝稚柳雪景山水20圖

      本地新聞

      即將過去的2025年,對重慶的影響竟然如此深遠

      房產要聞

      中旅?三亞藍灣展示中心璀璨綻放,共鑒灣心孤品傳奇

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 人人妻人人插视频| 岛国无码精品| 久久内射| 内射干少妇亚洲69XXX| 最近免费中文字幕大全| 亚洲的天堂av无码| 国产v亚洲v天堂a无码99| 遂川县| 九一国产精品| 屁屁影院国产第一页| 亚洲都市激情| 国产精品偷伦费观看一次 | 亚洲日韩人妻在线| 亚洲欧洲制服| 一本色道久久综合亚洲精品按摩| 大桥未久亚洲无av码在线| 亚洲欧洲日产国码高潮αv| 欧美成人精品a∨在线观看| 国产欧美日韩精品a在线观看| 日韩精品人妻中文字幕不卡| 普洱| 亚洲色性| 中文字幕一区二区三区四区50岁 | 亚洲丝袜熟女在线樱桃| 久久天堂综合亚洲伊人HD妓女| Y111111国产精品久久久| 国产在线精品一区二区不卡麻豆| 亚洲 欧美 变态 另类 综合| 国产精品毛片无遮挡高清| 久久婷婷五月综合色和啪| 成人午夜精品无码区久久| 无码人妻丰满熟妇啪啪| 久久一本人碰碰人碰| 人摸人人人澡人人超碰97| 日屄影视| 日日插插| 撸撸狠| 国产精品无码素人福利不卡| 亚洲高清国产拍精品熟女| 午夜福利看片在线观看| 国产97人人超碰CAO蜜芽PROM |