千問大模型每天要處理多少用戶請(qǐng)求?這個(gè)數(shù)字恐怕連阿里自己都難以精確統(tǒng)計(jì)。但如今,支撐這些海量計(jì)算的,已不再是清一色的英偉達(dá)GPU。
就在今天,阿里巴巴旗下半導(dǎo)體公司“平頭哥”官網(wǎng)悄然上線了名為“真武810E”的高端AI芯片。
![]()
圖源:平頭哥
這款此前經(jīng)央視《新聞聯(lián)播》曝光的PPU,官方參數(shù)顯示其整體性能與英偉達(dá)H20相當(dāng),標(biāo)志著阿里成為全球第二家實(shí)現(xiàn)大模型研發(fā)、云計(jì)算平臺(tái)與AI芯片全鏈條自主設(shè)計(jì)與制造的科技企業(yè)。
![]()
阿里“真武”亮劍
根據(jù)披露的技術(shù)參數(shù),“真武810E”配備了96GB的HBM2e高帶寬內(nèi)存,芯片間互聯(lián)帶寬高達(dá)700GB/s,支持PCIe 5.0接口,整卡功耗控制在400W左右。
而對(duì)比來看,英偉達(dá)H20的賣點(diǎn)正是其96GB的HBM3內(nèi)存和900GB/s的NVLink帶寬,功耗卻高達(dá)550W。
可以說,阿里的“真武”在顯存容量上完成了對(duì)齊,在互聯(lián)帶寬上達(dá)到了H20的75%以上,并大幅超越了之前的A800。
這背后傳遞出一個(gè)冷峻的現(xiàn)實(shí):國產(chǎn)芯片廠商已經(jīng)放棄了在“單卡絕對(duì)峰值算力”上與英偉達(dá)H100/H200死磕(受限于制造工藝和制程),轉(zhuǎn)而尋找一種更務(wù)實(shí)的“系統(tǒng)級(jí)平衡”。
阿里很清楚,如果能在通信帶寬上咬住英偉達(dá),通過萬卡集群的規(guī)模效應(yīng),完全可以彌補(bǔ)單片性能的微弱差距。
![]()
圖源:《財(cái)經(jīng)》雜志
另一方面,“真武”之所以被稱為PPU(Parallel Processing Unit,并行處理器),而非傳統(tǒng)的GPU(圖形處理器),是因?yàn)樗鼜脑O(shè)計(jì)之初就剝離了圖形渲染等冗余功能。
作為阿里全棧自研的產(chǎn)物,“真武”在硬件架構(gòu)上針對(duì)Transformer結(jié)構(gòu)的大模型做了深度優(yōu)化。
在同等算力指標(biāo)下,運(yùn)行通義千問(Qwen)等模型的效率,會(huì)由于底層指令集的匹配而獲得額外加成。這種“專芯專用”的思路,正是阿里敢于對(duì)標(biāo)英偉達(dá)的底氣所在。
不過,我們也必須客觀看到,在HBM技術(shù)路徑上,阿里選擇的是HBM2e而非最先進(jìn)的HBM3/3e。
但這不叫“落后”,而是一種基于供應(yīng)鏈安全的防御性選擇。
當(dāng)前全球HBM產(chǎn)能高度緊張,且先進(jìn)制程封裝(CoWoS)依然是扼住國產(chǎn)芯片咽喉的繩索。
阿里通過自研并行計(jì)算架構(gòu),試圖用更成熟的封裝工藝和內(nèi)存方案,實(shí)現(xiàn)接近頂尖芯片的效果,這叫“工程學(xué)上的最優(yōu)折中”。
![]()
從“平頭哥”到“通云哥”,阿里的鐵三角陽謀
如果只看芯片,我們看到的只是孤島。
但如果把平頭哥放在阿里巴巴的整體版圖中,你會(huì)發(fā)現(xiàn)一個(gè)名為“通云哥”的龐然大物正在成型。
所謂“通云哥”,即:通義大模型+阿里云+平頭哥。這個(gè)組合在全球范圍內(nèi),只有谷歌(TPU+Google Cloud+Gemini)能與之完全對(duì)應(yīng)。
甚至連英偉達(dá),在缺乏自研大模型和頂級(jí)公有云業(yè)務(wù)的閉環(huán)下,在生態(tài)縱深上也略遜一籌。
![]()
圖源:每日經(jīng)濟(jì)新聞
而這背后,是阿里長達(dá)17年持續(xù)戰(zhàn)略投入的結(jié)果:
從2009年創(chuàng)建阿里云,到2018年收購中天微并成立平頭哥芯片公司,再到2019年啟動(dòng)大模型研究,阿里在關(guān)鍵技術(shù)領(lǐng)域的長期主義投入,終于在今天形成了協(xié)同效應(yīng)。
相比單一環(huán)節(jié)的創(chuàng)新,這種全棧優(yōu)化帶來的效率提升和成本降低是幾何級(jí)的。
在傳統(tǒng)的采購模式下,阿里云購買英偉達(dá)的芯片,模型層調(diào)優(yōu)算法。這種“拼積木”的方式在算力過剩時(shí)代沒有問題。但現(xiàn)在,每一片芯片都價(jià)值連城,每一瓦功耗都影響利潤。
因此,阿里自研芯片最大的優(yōu)勢(shì)就在于“軟硬一體的深度調(diào)優(yōu)”。
當(dāng)通義實(shí)驗(yàn)室的算法專家發(fā)現(xiàn)某個(gè)算子在訓(xùn)練中存在瓶頸時(shí),他們可以直接與平頭哥的硬件工程師對(duì)話,在芯片層級(jí)進(jìn)行優(yōu)化——這是任何第三方芯片廠商無法提供的。
據(jù)業(yè)內(nèi)估算,這種垂直整合帶來的系統(tǒng)能效提升,往往能抵消制程落后帶來的20%-30%的性能損耗。
![]()
圖源:微博
然而,國產(chǎn)芯片最大的挑戰(zhàn)不是“造不出來”,而是“沒人敢用”。
阿里解決這個(gè)問題的辦法很簡單:自己先用。
目前,“真武”PPU已經(jīng)在阿里云內(nèi)部實(shí)現(xiàn)了多個(gè)萬卡集群的部署。
背后的含義很清晰:當(dāng)這款芯片真正推向市場時(shí),它已經(jīng)經(jīng)歷了淘寶雙11的流量洪峰、千問大模型的萬億參數(shù)訓(xùn)練等種種高負(fù)荷場景的考驗(yàn)。
這種“自家果園實(shí)驗(yàn),自家超市售賣”的模式,徹底解決了國產(chǎn)芯片的信任危機(jī)。據(jù)悉,國家電網(wǎng)、小鵬汽車等400多家客戶已經(jīng)開始采用阿里方案,本質(zhì)上買的不是那一塊硅片,而是阿里在那塊硅片上跑通了的整套大模型基礎(chǔ)設(shè)施。
長期以來,中國AI開發(fā)者一直活在CUDA生態(tài)的陰影下。英偉達(dá)最強(qiáng)大的護(hù)城河不是算力,而是其近乎壟斷的底層軟件生態(tài)。
阿里通過自研芯片和與之配套的軟件棧,正在嘗試構(gòu)建一個(gè)基于國產(chǎn)算力的、可獨(dú)立演進(jìn)的生態(tài)支點(diǎn)。
如果“真武”能配合阿里云的算力調(diào)度系統(tǒng),讓開發(fā)者在不感知底層差異的情況下實(shí)現(xiàn)一鍵遷移,那么英偉達(dá)的護(hù)城河就出現(xiàn)了一道裂縫。
![]()
國產(chǎn)芯片沖刺IPO,仍需慎重
2026年初,平頭哥、昆侖芯、摩爾線程等芯片巨頭紛紛傳出上市消息。客觀來看,這不是資本的狂歡,更像是一場關(guān)于“存活”的賽跑。
眾所周知,芯片研發(fā)是一個(gè)吞金獸。
平頭哥成立8年來,依托阿里的海量投入,已經(jīng)完成了從RISC-V架構(gòu)(玄鐵)、服務(wù)器CPU(倚天)到AI芯片(含光、真武)的全線布局。
但在阿里整體戰(zhàn)略轉(zhuǎn)向“更加敏捷”的背景下,平頭哥的獨(dú)立IPO就顯得很有必要。
首先是降本增效。通過獨(dú)立上市,平頭哥可以利用資本市場的資金繼續(xù)進(jìn)行后續(xù)制程(如3nm/2nm)的研發(fā),減輕母公司的現(xiàn)金流壓力。
其次是去阿里化。作為獨(dú)立實(shí)體,平頭哥不僅能服務(wù)阿里云,更能以更加中立的身份去贏得競爭對(duì)手(如騰訊云、華為云或其他私有云客戶)的訂單。
只有成為“社會(huì)化產(chǎn)品”,國產(chǎn)芯片才能在真正的市場競爭中洗禮出生命力。
當(dāng)然,這并不意味著我們?cè)趪H市場已經(jīng)開始“遙遙領(lǐng)先”。
在狂熱的討論中,我們必須保持一份清醒。盡管“真武”在某些參數(shù)上比肩H20,但我們要意識(shí)到,H20本身就是英偉達(dá)為了適應(yīng)貿(mào)易規(guī)則而劃出的“天花板”。我們的“比肩”,在某種程度上是對(duì)比人家“退而求其次”的產(chǎn)品。
在單卡雙精度浮點(diǎn)運(yùn)算、先進(jìn)光刻工藝的獲取、以及全球開發(fā)者生態(tài)的粘性上,國產(chǎn)芯片依然面臨漫長的追趕。
阿里的“真武”是一個(gè)極好的開端,它證明了我們?cè)谔囟▓鼍啊⑻囟軜?gòu)下具備了與世界巨頭掰手腕的能力,但這并不意味著我們已經(jīng)可以高枕無憂。
未來的AI競爭,表面上是芯片性能的競爭,底層則是“算力能效比”的競爭,例如英偉達(dá)的Blackwell架構(gòu)已經(jīng)在追求單卡功耗超過1000W。
而對(duì)于中國而言,電力資源和碳中和目標(biāo)決定了我們不能無止境地推高功耗。
阿里的機(jī)會(huì)在于,如何利用其在云計(jì)算調(diào)度上的積累,讓算力像自來水一樣,經(jīng)過高效的處理和分配,以最低的成本觸達(dá)企業(yè)。
如果“真武”芯片能配合阿里的液冷數(shù)據(jù)中心技術(shù)和分布式并行框架,實(shí)現(xiàn)比英偉達(dá)方案更優(yōu)的“單位算力成本”,那么在商業(yè)邏輯上,阿里就贏了。
對(duì)于阿里巴巴而言,平頭哥的獨(dú)立與“真武”的實(shí)戰(zhàn),同樣意味著它正在完成從一家“互聯(lián)網(wǎng)公司”向“硬核AI基礎(chǔ)設(shè)施供應(yīng)商”的驚險(xiǎn)一躍。
作者 | 劉峰
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.