<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      推理成本打到1元/百萬token,浪潮撬動Agent規(guī)模化“最后一公里”

      0
      分享至

      允中 發(fā)自 凹非寺
      量子位 | 公眾號 QbitAI

      當(dāng)前全球AI產(chǎn)業(yè)已從模型性能競賽邁入智能體規(guī)模化落地的“生死競速”階段,“降本”不再是可選優(yōu)化項(xiàng),而是決定AI企業(yè)能否盈利、行業(yè)能否突破的核心命脈。

      在此大背景下,浪潮信息推出元腦HC1000超擴(kuò)展AI服務(wù)器,將推理成本首次擊穿至1元/每百萬token

      這一突破不僅有望打通智能體產(chǎn)業(yè)化落地“最后一公里”的成本障礙,更將重塑AI產(chǎn)業(yè)競爭的底層邏輯。

      浪潮信息首席AI戰(zhàn)略官劉軍強(qiáng)調(diào):

      • 當(dāng)前1元/每百萬token的成本突破僅是階段性勝利,面對未來token消耗量指數(shù)級增長、復(fù)雜任務(wù)token需求激增數(shù)十倍的必然趨勢,現(xiàn)有成本水平仍難支撐AI的普惠落地。

      未來,AI要真正成為如同 “水電煤” 般的基礎(chǔ)資源,token成本必須在現(xiàn)有基礎(chǔ)上實(shí)現(xiàn)數(shù)量級跨越,成本能力將從“核心競爭力”進(jìn)一步升級為“生存入場券”,直接決定AI企業(yè)在智能體時代的生死存亡。


      △浪潮信息首席AI戰(zhàn)略官劉軍

      智能體時代,token成本就是競爭力

      回顧互聯(lián)網(wǎng)發(fā)展史,基礎(chǔ)設(shè)施的“提速降費(fèi)”是行業(yè)繁榮的重要基石。

      從撥號上網(wǎng)以Kb計(jì)費(fèi),到光纖入戶后百兆帶寬成為標(biāo)配,再到4G/5G時代數(shù)據(jù)流量成本趨近于零——每一次通信成本的顯著降低,都推動了如視頻流媒體、移動支付等全新應(yīng)用生態(tài)的爆發(fā)。

      當(dāng)前的AI時代也處于相似的臨界點(diǎn),當(dāng)技術(shù)進(jìn)步促使token單價下滑之后,企業(yè)得以大規(guī)模地將AI應(yīng)用于更復(fù)雜、更耗能的場景,如從早期的簡短問答,到如今支持超長上下文、具備多步規(guī)劃與反思能力的智能體……

      這也導(dǎo)致單任務(wù)對token的需求已呈指數(shù)級增長。如果token成本下降的速度跟不上消耗量的指數(shù)增長,企業(yè)將面臨更高的費(fèi)用投入,這昭示著經(jīng)濟(jì)學(xué)中著名的“杰文斯悖論”正在token經(jīng)濟(jì)中完美重演。

      (杰文斯悖論是1865年經(jīng)濟(jì)學(xué)家威廉·斯坦利·杰文斯提出的悖論:指當(dāng)技術(shù)進(jìn)步提高了效率,資源消耗不僅沒有減少,反而激增。例如,瓦特改良的蒸汽機(jī)讓煤炭燃燒更加高效,但結(jié)果卻是煤炭需求飆升。)

      來自多方的數(shù)據(jù)也有力佐證了token消耗量的指數(shù)級增長趨勢。

      • 火山引擎最新披露的數(shù)據(jù)顯示,截至今年12月,字節(jié)跳動旗下豆包大模型日均token使用量突破50萬億,較去年同期增長超過10倍,相比2024年5月剛推出時的日均調(diào)用量增長達(dá)417倍;
      • 谷歌在10月披露,其各平臺每月處理的token用量已達(dá),相當(dāng)于日均43.3萬億,而一年前月均僅為9.7萬億。


      △谷歌公布其token處理量變化

      當(dāng)使用量達(dá)到“百萬億token/月”的量級時,哪怕每百萬token成本只下降1美元,也可能帶來每月1億美元的成本差異。

      對此,劉軍認(rèn)為:

      • token成本就是競爭力,它直接決定了智能體的盈利能力。要讓AI真正進(jìn)入規(guī)模化普惠階段,token成本必須在現(xiàn)有基礎(chǔ)上繼續(xù)實(shí)現(xiàn)數(shù)量級的下降。
      深挖token成本“暗箱”:架構(gòu)不匹配是核心瓶頸

      當(dāng)下,全球大模型競賽從“盲目堆算力”轉(zhuǎn)向“追求單位算力產(chǎn)出價值”的新階段。

      單位算力產(chǎn)出價值受到能源價格、硬件采購成本、算法優(yōu)化、運(yùn)營成本等多種因素的影響,但不可否認(rèn)的是,現(xiàn)階段token成本80%以上依然來自算力支出。

      而阻礙成本下降的核心矛盾,在于推理負(fù)載與訓(xùn)練負(fù)載截然不同,沿用舊架構(gòu)會導(dǎo)致算力、顯存與網(wǎng)絡(luò)資源難以同時最優(yōu),造成嚴(yán)重的“高配低效”。

      一是算力利用率(MFU)的嚴(yán)重倒掛

      訓(xùn)練階段MFU可達(dá)50%以上,但在推理階段,特別是對于追求低延遲的實(shí)時交互任務(wù),由于token的自回歸解碼特性,在每一輪計(jì)算中,硬件必須加載全部的模型參數(shù),卻只為了計(jì)算一個token的輸出,導(dǎo)致昂貴的GPU大部分時間在等待數(shù)據(jù)搬運(yùn),實(shí)際MFU往往僅為5%-10%。這種巨大的算力閑置是成本高企的結(jié)構(gòu)性根源。

      二是“存儲墻”瓶頸在推理場景下被放大

      在大模型推理中,隨著上下文長度的增加,KV Cache呈指數(shù)級增長。這不僅占用了大量的顯存空間,還導(dǎo)致了由于訪存密集帶來的高功耗。

      這種存算分離不僅帶來數(shù)據(jù)遷移功耗和延遲,還必須配合使用價格高昂的HBM,已經(jīng)成為阻礙token成本下降的重要瓶頸。

      三是網(wǎng)絡(luò)通信與橫向擴(kuò)展代價愈發(fā)高昂

      當(dāng)模型規(guī)模突破單機(jī)承載能力時,跨節(jié)點(diǎn)通信成為新瓶頸。傳統(tǒng)RoCE或InfiniBand網(wǎng)絡(luò)的延遲遠(yuǎn)高于芯片內(nèi)部的總線延遲,通信開銷可能占據(jù)總推理時間的30%以上,導(dǎo)致企業(yè)被迫通過堆砌更多資源來維持響應(yīng)速度,推高了總擁有成本(TCO)。

      對此,劉軍指出,降低token成本的核心不是“把一臺機(jī)器做得更全”,而是圍繞目標(biāo)重構(gòu)系統(tǒng)

      把推理流程拆得更細(xì),支持P/D分離、A/F分離、KV并行、細(xì)粒度專家拆分等計(jì)算策略,讓不同計(jì)算模塊在不同卡上按需配置并發(fā),把每張卡的負(fù)載打滿,讓“卡時成本”更低、讓“卡時產(chǎn)出”更高。

      基于全新超擴(kuò)展架構(gòu),元腦HC1000實(shí)現(xiàn)推理成本首次擊破1元/每百萬token

      當(dāng)前主流大模型的token成本依然高昂。以輸出百萬token為例,Claude、Grok等模型的價格普遍在10-15美元,國內(nèi)大模型雖然相對便宜,也多在10元以上。

      在天文數(shù)字級別的調(diào)用量下,如此高的token成本讓大規(guī)模商業(yè)化應(yīng)用面臨嚴(yán)峻的ROI挑戰(zhàn)。

      因此,要打破成本僵局,必須從計(jì)算架構(gòu)層面進(jìn)行根本性重構(gòu),從而大幅提升單位算力的產(chǎn)出效率。


      △主流LLM的百萬token價格

      為此,浪潮信息推出元腦HC1000超擴(kuò)展AI服務(wù)器

      該產(chǎn)品基于全新設(shè)計(jì)的全對稱DirectCom極速架構(gòu),采用無損超擴(kuò)展設(shè)計(jì),可高效聚合海量本土AI芯片,支持極大推理吞吐量,推理成本首次擊破1元/每百萬token,為智能體突破token成本瓶頸提供極致性能的創(chuàng)新算力系統(tǒng)。


      △元腦HC1000超擴(kuò)展AI服務(wù)器

      對此,劉軍表示:

      • 我們看到原來的AI計(jì)算是瞄著大而全去建設(shè)的,五臟俱全,各種各樣的東西都在里面。但是當(dāng)我們聚焦降低token成本這一核心目標(biāo)之后,我們重新思考系統(tǒng)架構(gòu)設(shè)計(jì),找到系統(tǒng)瓶頸,重構(gòu)出一個極簡設(shè)計(jì)的系統(tǒng)。

      元腦HC1000創(chuàng)新設(shè)計(jì)了DirectCom極速架構(gòu),每計(jì)算模組配置16顆AIPU,采用直達(dá)通信設(shè)計(jì),解決傳統(tǒng)架構(gòu)的協(xié)議轉(zhuǎn)換和帶寬爭搶問題,實(shí)現(xiàn)超低延遲;計(jì)算通信1:1均衡配比,實(shí)現(xiàn)全局無阻塞通信;全對稱的系統(tǒng)拓?fù)湓O(shè)計(jì),可以支持靈活的PD分離、AF分離方案,按需配置計(jì)算實(shí)例,最大化資源利用率。


      △全對稱DirectCom極速架構(gòu)

      同時,元腦HC1000支持超大規(guī)模無損擴(kuò)展,DirectCom架構(gòu)保障了計(jì)算和通信均衡,通過算網(wǎng)深度協(xié)同、全域無損技術(shù)實(shí)現(xiàn)推理性能1.75倍提升,并且通過對大模型的計(jì)算流程細(xì)分和模型結(jié)構(gòu)解耦,實(shí)現(xiàn)計(jì)算負(fù)載的靈活按需配比,單卡MFU最高可提升5.7倍。


      △超大規(guī)模無損擴(kuò)展

      此外,元腦HC1000通過自適應(yīng)路由和智能擁塞控制算法,提供數(shù)據(jù)包級動態(tài)負(fù)載均衡,實(shí)現(xiàn)KV Cache傳輸和All to All通信流量的智能調(diào)度,將KV Cache傳輸對Prefill、Decode計(jì)算實(shí)例影響降低5-10倍。

      劉軍強(qiáng)調(diào),當(dāng)前“1元/每百萬token”還遠(yuǎn)遠(yuǎn)不夠,面對未來token消耗量的指數(shù)級增長,若要實(shí)現(xiàn)單token成本的持續(xù)、數(shù)量級下降,需要推動計(jì)算架構(gòu)的根本性革新。

      這也要求整個AI產(chǎn)業(yè)的產(chǎn)品技術(shù)創(chuàng)新,要從當(dāng)前的規(guī)模導(dǎo)向轉(zhuǎn)為效率導(dǎo)向,從根本上重新思考和設(shè)計(jì)AI計(jì)算系統(tǒng),發(fā)展AI專用計(jì)算架構(gòu),探索開發(fā)大模型芯片,推動算法硬件化的專用計(jì)算架構(gòu)創(chuàng)新,實(shí)現(xiàn)軟硬件深度優(yōu)化,這將是未來的發(fā)展方向。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      美國不買了,李嘉誠港口爛在手里,中國獲得巴拿馬運(yùn)河港口控制權(quán)

      美國不買了,李嘉誠港口爛在手里,中國獲得巴拿馬運(yùn)河港口控制權(quán)

      博覽歷史
      2025-12-26 19:22:42
      河南15歲男孩劉一圣去世,因摔倒被確診,前后僅一年,媽媽是網(wǎng)紅

      河南15歲男孩劉一圣去世,因摔倒被確診,前后僅一年,媽媽是網(wǎng)紅

      鋭娛之樂
      2025-12-26 08:15:41
      研究發(fā)現(xiàn):主食一換,每年癌死少一半,提倡吃4種主食,建議看看

      研究發(fā)現(xiàn):主食一換,每年癌死少一半,提倡吃4種主食,建議看看

      展望云霄
      2025-12-17 21:34:55
      南博事件挖到“承重墻”!篡改歷史,一場布局幾代人的古董騙局

      南博事件挖到“承重墻”!篡改歷史,一場布局幾代人的古董騙局

      垛垛糖
      2025-12-25 16:47:36
      女星離婚兩年仍與前夫同住,二人面對鏡頭落淚:很難熬,撐不住了

      女星離婚兩年仍與前夫同住,二人面對鏡頭落淚:很難熬,撐不住了

      書寫傳奇
      2025-12-25 15:32:07
      太頂了!明明什么都沒露,卻性感得要命!

      太頂了!明明什么都沒露,卻性感得要命!

      貴圈真亂
      2025-12-20 12:02:06
      特稱美將增加航母數(shù)量;為引導(dǎo)遠(yuǎn)程反艦彈,美國需要彈射版美國級

      特稱美將增加航母數(shù)量;為引導(dǎo)遠(yuǎn)程反艦彈,美國需要彈射版美國級

      嘯鷹評
      2025-12-25 23:23:31
      首批中國游客赴俄遭“天價宰殺”落地即“失聯(lián)”支付系統(tǒng)全面失靈

      首批中國游客赴俄遭“天價宰殺”落地即“失聯(lián)”支付系統(tǒng)全面失靈

      深度報
      2025-12-23 22:47:10
      幸虧中國沒參與,越南南北高鐵受挫,大財團(tuán)撤資,美國投資商跑路

      幸虧中國沒參與,越南南北高鐵受挫,大財團(tuán)撤資,美國投資商跑路

      時尚的弄潮
      2025-12-26 12:56:58
      不尋常!拜登發(fā)布了一張全家福圣誕賀照片,大部分身體被妻子遮擋

      不尋常!拜登發(fā)布了一張全家福圣誕賀照片,大部分身體被妻子遮擋

      我是盲流
      2025-12-26 08:31:25
      章澤天帶女兒迪拜過圣誕!住全球最貴酒店,穿老錢風(fēng)坐泳池旁看書

      章澤天帶女兒迪拜過圣誕!住全球最貴酒店,穿老錢風(fēng)坐泳池旁看書

      春風(fēng)笑語
      2025-12-26 11:40:32
      錢再多有啥用?身價5億英鎊的貝克漢姆現(xiàn)狀,給所有運(yùn)動員提了醒

      錢再多有啥用?身價5億英鎊的貝克漢姆現(xiàn)狀,給所有運(yùn)動員提了醒

      洲洲影視娛評
      2025-12-25 20:19:03
      BBA拼死一搏!奧迪A6L降20萬,網(wǎng)友:國產(chǎn)反超有點(diǎn)難

      BBA拼死一搏!奧迪A6L降20萬,網(wǎng)友:國產(chǎn)反超有點(diǎn)難

      汽車網(wǎng)評
      2025-12-26 20:51:31
      支持中國分裂,拒飛內(nèi)地航線,歧視大陸游客的國泰航空,如今怎樣

      支持中國分裂,拒飛內(nèi)地航線,歧視大陸游客的國泰航空,如今怎樣

      小莜讀史
      2025-12-15 21:00:06
      脫衣舞愛豆當(dāng)性n服務(wù)大佬

      脫衣舞愛豆當(dāng)性n服務(wù)大佬

      毒舌扒姨太
      2025-12-25 22:44:29
      一個月后,中洪恐?jǐn)嘟唬槎祭剐驴偨y(tǒng):中國大陸不給我們好處

      一個月后,中洪恐?jǐn)嘟唬槎祭剐驴偨y(tǒng):中國大陸不給我們好處

      博覽歷史
      2025-12-25 18:31:13
      吳尊一家過圣誕節(jié),被44歲的汪東城成功搶鏡!不結(jié)婚少年感仍然在

      吳尊一家過圣誕節(jié),被44歲的汪東城成功搶鏡!不結(jié)婚少年感仍然在

      巧手曉廚娘
      2025-12-26 21:30:50
      南博事件發(fā)酵!吳家哭訴,和龐家同病相憐,我們家捐的文物也丟了

      南博事件發(fā)酵!吳家哭訴,和龐家同病相憐,我們家捐的文物也丟了

      火山詩話
      2025-12-24 17:35:41
      早有嫌隙?雷迪克2年前曾評價里夫斯:他總是找借口,從不承擔(dān)責(zé)任

      早有嫌隙?雷迪克2年前曾評價里夫斯:他總是找借口,從不承擔(dān)責(zé)任

      懂球帝
      2025-12-27 01:50:06
      2036年奧運(yùn)會舉辦地,有兩個國家很頭痛,一個中國,另一個是印度

      2036年奧運(yùn)會舉辦地,有兩個國家很頭痛,一個中國,另一個是印度

      扶蘇聊歷史
      2025-12-26 18:01:18
      2025-12-27 06:24:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動態(tài)
      11927文章數(shù) 176344關(guān)注度
      往期回顧 全部

      科技要聞

      收割3000億!拼多多"土辦法"熬死所有巨頭

      頭條要聞

      老人婚宴上被提醒孫女非親生 做鑒定后忍3年忍不了了

      頭條要聞

      老人婚宴上被提醒孫女非親生 做鑒定后忍3年忍不了了

      體育要聞

      開翻航母之后,他決定親手造一艘航母

      娛樂要聞

      王傳君生病后近照變化大,面部浮腫

      財經(jīng)要聞

      投資巨鱷羅杰斯最新持倉:只留四種資產(chǎn)

      汽車要聞

      兩大CEO試駕 華為乾崑*啟境開啟首款獵裝轎跑路測

      態(tài)度原創(chuàng)

      旅游
      藝術(shù)
      親子
      家居
      房產(chǎn)

      旅游要聞

      百年老街變身!上海新天地東臺里開業(yè),解鎖冬日消費(fèi)新范式

      藝術(shù)要聞

      閆平 2025油畫作品欣賞

      親子要聞

      2025年即將過去,準(zhǔn)備好一大波溫暖瞬間來襲

      家居要聞

      格調(diào)時尚 智慧品質(zhì)居所

      房產(chǎn)要聞

      炸裂,三亞360億超級清單發(fā)布,又一批重大配套要來了!

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 国产91小视频在线观看| 天天躁人人躁人人躁狂躁| 99伊人| 亚洲精品自拍| 马龙县| 美女内射毛片在线看免费人动物| 精精国产xxxx视频在线播放| 精品熟女少妇免费久久| 99白浆| 黄色日韩欧美视频免费在线观看| 亚洲国产成人精品无码一区二区| 撕开奶罩揉吮奶头高潮AV| 欧美午夜福利| 色小说综合网| 狠狠婷婷综合久久久久久| 国模吧无码一区二区三区| 久久国产AV| 噶尔县| 熟女视频一区二区在线观看| 九九伊人| 中文字幕第4页| www.av小说| 亚洲日韩乱码中文无码蜜桃臀| 亚洲精品乱码久久久久久中文字幕| 永久免费mv入口| 亚洲精品一品| 欧美日韩精品久久久免费观看| 丝袜美腿视频一区二区三区| 青青草99| 伊人在线亚洲| 日韩欧美激情兽交| 蜜芽久久人人超碰爱香蕉| 亚洲AV无一区二区三区久久| 香港三级韩国三级日本三级 | 级r片内射在线视频播放| 中文成人无字幕乱码精品区| 91视频在| 国产高跟黑色丝袜在线| 中文字幕av无码不卡| 极品虎白一线天馒头最新消息| 芮城县|