![]()
開年以來,AI行業(yè)最大的變化,就是Token成為日常工作的基礎(chǔ)配置。
以O(shè)penClaw為代表的AI智能體爆發(fā),按Token計(jì)費(fèi)的算力消耗也一路飆升。黃仁勛就表示,未來工程師的年薪里要包含Token預(yù)算,比例甚至可能達(dá)到年薪的一半。而騰訊、阿里也被曝出,開始向員工發(fā)放AI調(diào)用額度。
面對(duì)這股Token熱潮,很多企業(yè)管理者和IT負(fù)責(zé)人都在犯愁:以前給員工發(fā)工資,發(fā)完現(xiàn)金就完事,可現(xiàn)在還得額外給員工發(fā)Token,而這些Token本質(zhì)都來自算力,傳統(tǒng)8卡機(jī)力不從心,動(dòng)輒百卡、千卡的超大集群,是中小企業(yè)難以承受之重。
怎么搞到足夠的Token給員工花?成了企業(yè)智能化的頭號(hào)難題。
恰逢2026年中關(guān)村論壇召開,以“科技創(chuàng)新與產(chǎn)業(yè)創(chuàng)新深度融合”為主線,算力趨勢(shì)也在與會(huì)嘉賓的交流中得到了印證。現(xiàn)實(shí)中,算力已經(jīng)從少數(shù)科技巨頭的戰(zhàn)略資源,成為更多組織的基礎(chǔ)配置。在此背景下,中科曙光于論壇現(xiàn)場(chǎng),發(fā)布了世界首個(gè)無線纜箱式超節(jié)點(diǎn)scaleX40并開啟全渠道預(yù)售,為企業(yè)算力選型提供了更普惠的選擇。
![]()
當(dāng)下,企業(yè)落地AI正在告別不計(jì)成本的FOMO擴(kuò)張期,進(jìn)入精打細(xì)算的務(wù)實(shí)階段,就連OpenAI都在主動(dòng)下調(diào)算力支出規(guī)劃。所以,超節(jié)點(diǎn)不能成為企業(yè)現(xiàn)金流的碎鈔機(jī),打破越大越好的規(guī)模迷信正當(dāng)其時(shí)。如何找到算力投入與業(yè)務(wù)價(jià)值的黃金平衡點(diǎn),有必要先洞穿一下企業(yè)算力的成本陷阱。
![]()
云端算力雖然靈活,可一旦AI在業(yè)務(wù)中規(guī)模化落地,按Token計(jì)費(fèi)的成本就會(huì)呈指數(shù)級(jí)暴漲,企業(yè)反倒淪為給云廠商打工。所以,仍有大量企業(yè)選擇自建算力基礎(chǔ)設(shè)施,相當(dāng)于自己造一座Token工廠。
可自建算力的道路,同樣布滿陷阱。
絕大多數(shù)企業(yè)的主流AI應(yīng)用場(chǎng)景,集中在推理、后訓(xùn)練環(huán)節(jié)。這時(shí)候,傳統(tǒng)8卡服務(wù)器性能嚴(yán)重不足,面對(duì)多智能體協(xié)作、高并發(fā)實(shí)時(shí)推理等復(fù)雜需求,就像小馬拉大車,滿足不了企業(yè)用AI的需求,這類傳統(tǒng)基建的投入實(shí)屬無效投資。
![]()
但盲目追求千卡、萬卡級(jí)別的大型集群,不僅成本高,還要面臨復(fù)雜運(yùn)維,從來都是頭部互聯(lián)網(wǎng)大廠的專屬配置。而且,大多數(shù)企業(yè)內(nèi)部的AI用量是緩慢上升的,可能一段時(shí)間里,真金白銀買來的大型集群都處于閑置空載狀態(tài),算力資源利用率低,也讓重金采購(gòu)的超節(jié)點(diǎn)變成了24小時(shí)不停運(yùn)轉(zhuǎn)的碎鈔機(jī)。
這就是當(dāng)下企業(yè)AI落地的真實(shí)困境:想吃到AI紅利的甜,卻得先品嘗算力選型的苦。
既有支撐復(fù)雜推理的實(shí)力,又不能貴得讓企業(yè)望而卻步,成了智算產(chǎn)業(yè)必須解決的問題。在2026年中關(guān)村論壇,業(yè)界共識(shí)是,30~70卡正在成為當(dāng)下算力甜點(diǎn)區(qū)間。
![]()
不同階段,企業(yè)引入的AI應(yīng)用與需求不同,算力甜點(diǎn)也會(huì)隨之變化。據(jù)中科曙光的專家透露,2025年DeepSeek爆火,當(dāng)時(shí)的八卡一體機(jī)能夠滿足對(duì)話式AI的推理需求,算是企業(yè)算力甜點(diǎn)。而進(jìn)入2026,一方面企業(yè)AI應(yīng)用場(chǎng)景增多,另一方面出現(xiàn)了OpenClaw這類高度自動(dòng)化、Token消耗量巨大的新應(yīng)用,所以企業(yè)算力的甜點(diǎn)區(qū)間也發(fā)生了位移。
當(dāng)前,30卡~70卡的中小規(guī)模超節(jié)點(diǎn),是企業(yè)算力的最佳甜點(diǎn)區(qū)間。這個(gè)區(qū)間是怎么測(cè)算出來的呢?
最核心的考量,是企業(yè)的實(shí)際業(yè)務(wù)場(chǎng)景與使用量。
當(dāng)前,企業(yè)核心的應(yīng)用場(chǎng)景分為高中低三類,相當(dāng)于小杯、中杯和大杯。其中,個(gè)人辦公助理、OCR識(shí)別等小并發(fā)、單一場(chǎng)景推理需求,30卡規(guī)格就能輕松支撐;通用大模型預(yù)訓(xùn)練、超高并發(fā)Agent服務(wù)等極少數(shù)場(chǎng)景,模型參數(shù)在671B以上,往往需要百卡以上集群。但絕大多數(shù)企業(yè),都不會(huì)自主訓(xùn)練基礎(chǔ)模型,普遍選擇API+微調(diào)+應(yīng)用,來進(jìn)行智能化,因此算力需求主要集中在實(shí)時(shí)推理、高并發(fā)、行業(yè)模型微調(diào)等,70卡以內(nèi)的中小規(guī)模超節(jié)點(diǎn),就能夠滿足這一主力區(qū)間的需求。
![]()
因此,將32~70卡的中小規(guī)模超節(jié)點(diǎn),作為算力甜點(diǎn)區(qū),對(duì)企業(yè)可以帶來幾方面的價(jià)值:
一是模型性能匹配。低于30卡,面對(duì)中等算力場(chǎng)景會(huì)出現(xiàn)顯存爆滿、推理延遲飆升的問題,比如員工跟智能體說一句話都要等上幾十秒,這種體驗(yàn)是不可能被業(yè)務(wù)側(cè)所接受的。通過Scale-Up全互連架構(gòu),30卡~70卡可以形成超大統(tǒng)一顯存池,突破單卡顯存物理瓶頸,支撐千億參數(shù)大模型推理、長(zhǎng)上下文交互等高階需求。
二是業(yè)務(wù)場(chǎng)景覆蓋。無論是企業(yè)內(nèi)部私有化知識(shí)庫搭建、垂直行業(yè)專屬大模型微調(diào),還是智能體高并發(fā)實(shí)時(shí)推理、多任務(wù)協(xié)同處理,30卡~70卡的中小規(guī)模超節(jié)點(diǎn)都能完美承接,適配90%的企業(yè)級(jí)AI應(yīng)用剛需場(chǎng)景,再結(jié)合靈活拓展的能力,能夠快速應(yīng)對(duì)后續(xù)模型迭代、Token用量激增也完全夠用。
三是成本合理控制。超節(jié)點(diǎn)規(guī)模越大,硬件采購(gòu)、機(jī)房運(yùn)維、電力消耗等開支也會(huì)指數(shù)級(jí)增加,邊際效益遞減。30卡~70卡區(qū)間,剛好平衡了業(yè)務(wù)載荷與成本控制。以區(qū)間核心40卡為例,中科曙光在scaleX40單節(jié)點(diǎn)集成40張GPU,在保障算力充足的同時(shí),系統(tǒng)可靠性提升至99.99%,也降低了架構(gòu)復(fù)雜度,穩(wěn)定性、能效性可有效降低運(yùn)維成本,全方位幫企業(yè)控制綜合成本。
歸根結(jié)底,企業(yè)部署超節(jié)點(diǎn),還是得靜下心回歸業(yè)務(wù)本質(zhì):假如做AI的最終目的,是落地變現(xiàn)、驅(qū)動(dòng)增長(zhǎng),那么30卡~70卡的中小規(guī)模超節(jié)點(diǎn),就是90%企業(yè)的最優(yōu)解。
![]()
可能很多人會(huì)問:道理都懂,可市面上為什么沒有滿足實(shí)際需求的中小規(guī)模超節(jié)點(diǎn)?需要砸墻鑿壁才能部署的超大算力巨獸,讓中小企業(yè)望而卻步。
根源就在于傳統(tǒng)架構(gòu)的硬傷。超節(jié)點(diǎn)的巨型機(jī)柜、復(fù)雜液冷散熱、雜亂銅纜布線等,太難伺候,跟大部分企業(yè)的現(xiàn)有機(jī)房完全無法適配。
深耕高性能計(jì)算起家的中科曙光,從早期的超級(jí)計(jì)算機(jī),到現(xiàn)在的大模型算力,打造了無數(shù)個(gè)世界領(lǐng)先級(jí)的系統(tǒng)。在推出全球首個(gè)單機(jī)柜級(jí)640卡超節(jié)點(diǎn)scaleX640之后,曙光洞察到,超節(jié)點(diǎn)不能只是少數(shù)頭部玩家的頂配裝備,90%企業(yè)需要的普惠超節(jié)點(diǎn),仍是市場(chǎng)空白。要幫助各行各業(yè)的企業(yè)實(shí)現(xiàn)AI化轉(zhuǎn)型,就必須有企業(yè)主動(dòng)突破傳統(tǒng)超節(jié)點(diǎn)的技術(shù)壁壘,而曙光恰好積累了大量的工程和研發(fā)經(jīng)驗(yàn),于是聚焦在30卡~70卡這一算力甜點(diǎn)區(qū)間,補(bǔ)齊這一關(guān)鍵生態(tài)位,打造出世界首款無線纜箱式超節(jié)點(diǎn)scaleX40。
![]()
假如企業(yè)使用AI,遇到下面這些煩惱時(shí)刻,scaleX40可能會(huì)是反復(fù)權(quán)衡之后的最佳收益點(diǎn)。
第一個(gè)時(shí)刻,當(dāng)業(yè)務(wù)人員想把AI智能體(比如OpenClaw)引入工作場(chǎng)景,發(fā)現(xiàn)算力不夠,服務(wù)器一直繁忙。
傳統(tǒng)服務(wù)器部署要改機(jī)房、調(diào)試要花好幾天。而scaleX40是無線纜正交設(shè)計(jì),不用復(fù)雜布線,買回來即插即用,像部署一臺(tái)普通服務(wù)器一樣簡(jiǎn)單便捷,不用一次性投入重金換設(shè)備。加上它的開放架構(gòu),和各種軟件、模型、合作伙伴無縫銜接,不用額外調(diào)試適配,主流AI應(yīng)用day0級(jí)上線。私有化部署還能保證業(yè)務(wù)數(shù)據(jù)不泄露,讓企業(yè)智能體、本地養(yǎng)龍蝦成為可能,幫助員工提升效率。
![]()
第二個(gè)時(shí)刻,是研發(fā)部門需要訓(xùn)練行業(yè)大模型、進(jìn)行復(fù)雜推理的時(shí)候。
不管是調(diào)優(yōu)行業(yè)專屬模型,還是處理海量數(shù)據(jù)、做高并發(fā)咨詢,傳統(tǒng)服務(wù)器要么卡頓半天,要么顯存不夠崩掉。scaleX40集成了144G大顯存,還用40卡高帶寬一級(jí)互連,把通信延遲降到最低,所有算力卡打通形成超大統(tǒng)一顯存池,單機(jī)就能支撐萬級(jí)并發(fā)交互。不管是萬億參數(shù)大模型推理、長(zhǎng)上下文交互,還是智能體高并發(fā)任務(wù)處理,都能流暢運(yùn)行。
![]()
第三個(gè)時(shí)刻,是IT同事日常運(yùn)維的時(shí)候,集群復(fù)雜度越高,出故障就是必然的,而中小企業(yè)的IT人員儲(chǔ)備,在應(yīng)對(duì)超大算力集群力不從心。
因此,scaleX40作為普惠超節(jié)點(diǎn),進(jìn)行了全鏈路極簡(jiǎn)優(yōu)化。一方面拋棄銅纜布線,改用無線纜正交對(duì)接架構(gòu),免去了繁瑣的理線工作,消滅了運(yùn)維噩夢(mèng),又大幅降低硬件損耗,設(shè)備可靠性提升到99.99%,很少出故障。此外,搭載SothisAI一站式平臺(tái),從模型訓(xùn)練、推理部署到日常監(jiān)控、故障排查,全流程閉環(huán)操作,就算有問題也能快速排查,再也不用擔(dān)心硬件故障耽誤進(jìn)度。
![]()
說到底,超節(jié)點(diǎn)的產(chǎn)品創(chuàng)新,要能實(shí)實(shí)在在解決企業(yè)日常工作中的痛點(diǎn)。不管是普通員工用AI智能體辦公,還是負(fù)責(zé)人控制預(yù)算、考慮建設(shè)周期,都能感受到算力甜點(diǎn)帶來的價(jià)值與效率,算力建設(shè)變苦為甜,可能是scaleX40問世的最大價(jià)值。
站在整個(gè)企業(yè)AI落地的行業(yè)視角來看,40卡箱式超節(jié)點(diǎn)的出現(xiàn),或許將是企業(yè)算力投入邏輯的拐點(diǎn)。
時(shí)間來到2026年,AI行業(yè)已經(jīng)到了棄虛務(wù)實(shí)的臨界點(diǎn)。應(yīng)用層,OpenClaw憑借任務(wù)自主執(zhí)行能力而爆火,大家期盼AI應(yīng)用能夠真正解決問題、創(chuàng)造收益,在業(yè)務(wù)場(chǎng)景中釋放真正的生產(chǎn)力。底層的算力側(cè)也一樣,企業(yè)開始告別盲目堆卡,就連OpenAI也主動(dòng)下調(diào)了算力支出規(guī)劃,一個(gè)精打細(xì)算的時(shí)代正式到來。
![]()
總結(jié)一下就是,每一分算力投入、每一個(gè)Token,都要帶來業(yè)務(wù)價(jià)值。
對(duì)于廣大企業(yè)的CTO/CIO來說,AI化轉(zhuǎn)型已經(jīng)成為企業(yè)不可不做的選擇,算力也隨之變成了硬性支出。這種情況下,超節(jié)點(diǎn)作為承載算力、支撐Token供應(yīng)的核心載體,價(jià)值不言而喻。既要大膽布局AI,更要做清醒、理性的IT投資決策者,在算力甜點(diǎn)區(qū)間內(nèi)合理布局、量力而行,才能讓企業(yè)真正享受算力帶來的甜蜜。
40卡普惠超節(jié)點(diǎn)scaleX40的出現(xiàn),剛好踩中了這一時(shí)代需求。把極具成本壓力的超節(jié)點(diǎn),及時(shí)拉回了價(jià)值創(chuàng)造的正軌。
算力甜點(diǎn)的具體規(guī)格,或許會(huì)隨著AI技術(shù)的進(jìn)展而變化,但投入產(chǎn)出比最優(yōu)的核心宗旨,永遠(yuǎn)不會(huì)變。所以,超節(jié)點(diǎn)雖好,可不能貪杯。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.