2025年11月,安謀科技Arm China發(fā)布了一款可能改變端側(cè)AI游戲規(guī)則的產(chǎn)品“周易”X3 NPU IP。這場(chǎng)發(fā)布會(huì)并不張揚(yáng),但技術(shù)細(xì)節(jié)中透露出扎實(shí)的革新:8-80 FP8 TFLOPS浮點(diǎn)算力、256GB/s單核帶寬、72%的Prefill算力利用率……這些數(shù)字背后,是安謀科技對(duì)端側(cè)AI困境的深度思考。
從架構(gòu)革新到生態(tài)布局:NPU IP的“破局之道”
端側(cè)AI的悖論在于:既要應(yīng)對(duì)大模型的計(jì)算復(fù)雜度,又必須滿(mǎn)足功耗與成本的嚴(yán)苛限制。安謀科技的解法是“回歸第一性原理”,即根據(jù)端側(cè)AI應(yīng)用的具體需求來(lái)重新設(shè)計(jì)底層架構(gòu)。
與傳統(tǒng)NPU不同,“周易”X3專(zhuān)為大模型而生的DSP+DSA混合架構(gòu)像一套“組合工具”:DSP處理通用計(jì)算,DSA針對(duì)大模型的矩陣運(yùn)算、注意力機(jī)制(Transformer架構(gòu))等任務(wù)硬化加速。這種設(shè)計(jì)在Llama2 7B實(shí)測(cè)中展現(xiàn)出驚人效率:Decode階段帶寬利用率超100%,相當(dāng)于用1份硬件資源完成了1.2份任務(wù)。
![]()
更值得玩味的是WDC解壓硬件的設(shè)計(jì)思路。安謀科技沒(méi)有簡(jiǎn)單追求制程工藝升級(jí),而是通過(guò)“算法-硬件協(xié)同優(yōu)化”,讓軟件層完成模型權(quán)重的無(wú)損壓縮,硬件層實(shí)時(shí)解壓。
這種“以時(shí)間換空間”的策略,為帶寬受限的端側(cè)設(shè)備爭(zhēng)取到額外15%-20%的等效性能提升。如今,端側(cè)芯片的競(jìng)爭(zhēng)已從純算力轉(zhuǎn)向效率密度,X3的出現(xiàn)正當(dāng)其時(shí)。
軟硬協(xié)同:開(kāi)發(fā)者生態(tài)的“破冰之旅”
如果說(shuō)硬件是骨架,軟件生態(tài)才是血肉。安謀科技此次將Compass AI平臺(tái)的Parser、Optimizer等核心組件開(kāi)源,看似是技術(shù)決策,實(shí)則是生態(tài)戰(zhàn)略。
![]()
這種開(kāi)放性與安謀科技的定位密切相關(guān)。作為IP供應(yīng)商,其商業(yè)模式依賴(lài)于降低客戶(hù)的使用門(mén)檻。例如Compass平臺(tái)對(duì)Hugging Face模型的“一鍵部署”支持,本質(zhì)是縮短從算法驗(yàn)證到芯片落地的路徑。而動(dòng)態(tài)Shape優(yōu)化、多精度融合計(jì)算等特性,則反映出對(duì)行業(yè)碎片化需求的回應(yīng)——從智能座艙的實(shí)時(shí)性要求到AI手機(jī)的能效約束,X3試圖用同一套架構(gòu)應(yīng)對(duì)差異化場(chǎng)景。
端側(cè)AI的未來(lái):從“功能實(shí)現(xiàn)”到“體驗(yàn)重構(gòu)”
回顧“周易”產(chǎn)品線演進(jìn)(Z1至X3),可清晰看到安謀科技對(duì)技術(shù)趨勢(shì)的預(yù)判:Z1時(shí)代聚焦人臉識(shí)別等輕量任務(wù),X2支持Stable Diffusion意味著端側(cè)AI開(kāi)始處理創(chuàng)作型任務(wù),而X3對(duì)多模態(tài)模型的支持,則指向更本質(zhì)的變化,即端側(cè)設(shè)備正從工具演變?yōu)椤爸悄荏w”。
![]()
在現(xiàn)場(chǎng)Demo區(qū),X3運(yùn)行DeepSeek模型進(jìn)行文生文對(duì)話(huà)時(shí),響應(yīng)延遲已接近人類(lèi)對(duì)話(huà)節(jié)奏。這種流暢度不僅來(lái)自算力提升,更得益于AIFF硬件引擎將調(diào)度延遲壓降至微秒級(jí)。
![]()
值得注意的是,安謀科技在發(fā)布中反復(fù)強(qiáng)調(diào)“未來(lái)5年布局”。這種長(zhǎng)周期視角在快節(jié)奏的芯片行業(yè)頗為罕見(jiàn)。或許正如其戰(zhàn)略定位:NPU IP的本質(zhì)是提供“計(jì)算基座”,而非追逐短期熱點(diǎn)。當(dāng)行業(yè)仍在爭(zhēng)論“端側(cè)大模型是否偽命題”時(shí),X3已用實(shí)測(cè)數(shù)據(jù)證明,端側(cè)設(shè)備足以承載7B乃至更大規(guī)模參數(shù)模型的實(shí)時(shí)推理。
尾聲:無(wú)形IP與有形未來(lái)
安謀科技的發(fā)展在某種程度上是芯片行業(yè)的縮影,如同芯片是終端產(chǎn)品的靈魂一樣,IP廠商就像舞臺(tái)劇的編劇和舞美,雖不直接亮相臺(tái)前,卻決定著整場(chǎng)演出的水準(zhǔn)。在AI算力需求爆炸式增長(zhǎng)的今天,“周易”X3的價(jià)值或許不僅在于技術(shù)參數(shù),更在于提供一種范式:通過(guò)架構(gòu)創(chuàng)新與生態(tài)開(kāi)放,讓端側(cè)AI從“可能”走向“可行”。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.