![]()
【摘要】AIGC大模型能力提升10倍,8-80 FP8 TFLOPS,單Core帶寬256GB/s,CNN模型性能提升30%-50%, Prefill算力利用率達(dá)72%,Decode有效帶寬利用率超100%。
2025年11月13日,安謀科技在上海舉行新品發(fā)布會(huì),正式推出新一代NPU IP——“周易”X3,該產(chǎn)品采用專(zhuān)為大模型而生的最新DSP+DSA架構(gòu),兼顧C(jī)NN與Transformer,協(xié)同完善易用的“周易”NPU Compass AI軟件平臺(tái),致力于為基礎(chǔ)設(shè)施、智能汽車(chē)、移動(dòng)終端、智能物聯(lián)網(wǎng)四大領(lǐng)域提供AI計(jì)算核芯,打造端側(cè)AI計(jì)算效率新標(biāo)桿,加快邊緣及端側(cè)AI規(guī)模化部署。
![]()
圖1:“周易”X3 NPU IP亮點(diǎn)
硬件架構(gòu):專(zhuān)為大模型設(shè)計(jì)最新DSP+DSA架構(gòu)
“周易”X3基于專(zhuān)為大模型設(shè)計(jì)的最新DSP+DSA架構(gòu),從定點(diǎn)轉(zhuǎn)向浮點(diǎn)計(jì)算,單Cluster擁有8-80 FP8 TFLOPS算力且可靈活配置,單Core帶寬高達(dá)256GB/s,支持端側(cè)大模型運(yùn)行必備的W4A8/W4A16計(jì)算加速模式,集成安謀科技自研的解壓硬件WDC,使大模型Weight軟件無(wú)損壓縮后通過(guò)硬件解壓獲得額外約15%的等效帶寬,計(jì)算效率和計(jì)算密度大幅提升。
同時(shí),“周易”X3集成AI專(zhuān)屬硬件引擎AIFF,配合專(zhuān)用硬化調(diào)度器,實(shí)現(xiàn)超低至0.5%的CPU負(fù)載與低調(diào)度延遲,使NPU在并行處理多項(xiàng)AI任務(wù)時(shí),擁有高效流暢的體驗(yàn)。
軟件生態(tài):優(yōu)化大模型端到端性能,支持客戶(hù)自定義AI開(kāi)發(fā)
“周易”X3 搭載完善易用的Compass AI軟件平臺(tái),全面優(yōu)化大模型端到端性能。平臺(tái)廣泛兼容TensorFlow、ONNX、PyTorch等主流AI框架,具備業(yè)界領(lǐng)先的大模型動(dòng)態(tài)Shape支持能力,并支持GPTQ等大模型主流量化方案、 Hugging Face模型庫(kù),與LLM、VLM、VLA及MoE等模型。
![]()
圖 2:“周易”NPU Compass AI軟件平臺(tái)
同時(shí),安謀科技積極構(gòu)建開(kāi)放生態(tài),Compass AI軟件平臺(tái)已將Parser、Optimizer、Linux Driver、TVM 及內(nèi)部 IR 格式等核心組件相繼開(kāi)源,并擁有豐富的調(diào)試工具,可滿(mǎn)足開(kāi)發(fā)者白盒部署需求,且支持更易用的DSL算子編程語(yǔ)言,在深度開(kāi)發(fā)模式下,客戶(hù)可以使用平臺(tái)中的Compiler、Debugger和DSL語(yǔ)言開(kāi)發(fā)出自己的自定義算子,也可通過(guò)Parser、Optimizer等工具打造出屬于自己的模型編譯器,極大提升開(kāi)發(fā)效率。發(fā)布初期,“周易”Compass AI軟件平臺(tái)已支持超160 種算子與 270多種模型,顯著提升開(kāi)發(fā)部署效率,助力客戶(hù)快速實(shí)現(xiàn)AI 應(yīng)用創(chuàng)新與落地。
軟硬深度協(xié)同下,“周易”X3的性能顯著提升, CNN模型性能較上一代提升30%-50%,在同算力規(guī)格下,AIGC大模型能力提升10倍,這得益于16倍的FP16 TFLOPS、4倍的計(jì)算核心帶寬,以及超10倍的Softmax和LayerNorm性能提升共同驅(qū)動(dòng)。實(shí)測(cè)多核算力線性度達(dá)到70%-80%。實(shí)測(cè)大模型性能方面,“周易”X3 在Prefill階段算力利用率達(dá)72%,Decode階段有效帶寬利用率在開(kāi)啟WDC情況下超100%,充分釋放硬件算力潛力。
應(yīng)用場(chǎng)景:覆蓋基礎(chǔ)設(shè)施、智能汽車(chē)、移動(dòng)終端、智能物聯(lián)網(wǎng)四大領(lǐng)域
在應(yīng)用場(chǎng)景上,“周易”X3可廣泛應(yīng)用于加速卡、智能座艙、ADAS、具身智能、AI PC、AI手機(jī)、智能網(wǎng)關(guān)、智能IPC等AI設(shè)備,深度賦能四大核心領(lǐng)域,提升AI計(jì)算效率,優(yōu)化AI應(yīng)用體驗(yàn)。
·基礎(chǔ)設(shè)施:在加速卡場(chǎng)景中,支持CNN與大模型等多樣結(jié)構(gòu)的AI模型加速;
·智能汽車(chē):在ADAS系統(tǒng)中,可基于AI算力進(jìn)行為自動(dòng)泊車(chē)等輔助駕駛提供AI算力支持;在IVI系統(tǒng)中,支持基于語(yǔ)音與車(chē)內(nèi)外視頻圖像輸入的智能互動(dòng);
·移動(dòng)終端:在AI PC、AI手機(jī)上,可實(shí)現(xiàn)超分渲染,提升分辨率,并支持基于大模型的AI Agent應(yīng)用;
·智能物聯(lián)網(wǎng):在智能網(wǎng)關(guān)、智能IPC等設(shè)備中,提供本地AI推理能力,提升響應(yīng)速度,優(yōu)化智能體驗(yàn)。
周易“X3”的推出,進(jìn)一步完善了安謀科技NPU IP產(chǎn)品家族在端側(cè)AI領(lǐng)域的布局。目前,“周易”NPU產(chǎn)品線已全面覆蓋核心領(lǐng)域,可匹配多場(chǎng)景AI計(jì)算需求。未來(lái),安謀科技將積極響應(yīng)“AI+”行動(dòng)計(jì)劃,深耕技術(shù)創(chuàng)新,連接全球前沿技術(shù),攜手伙伴共建生態(tài),為國(guó)內(nèi)“AI+”產(chǎn)業(yè)升級(jí)構(gòu)建堅(jiān)實(shí)的智能計(jì)算基石。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.