不管是數(shù)據(jù)中心里耗電如喝水的服務(wù)器,還是咱們手上靠電池?fù)沃闹悄苁直怼卜罃z像頭,全被同一個(gè)問題卡脖子:老一套的芯片設(shè)計(jì)思路,跟不上AI的野路子了。
說白了,用了幾十年的馮諾依曼架構(gòu),這老伙計(jì)早就江郎才盡了。今天咱就扒一扒,芯片行業(yè)這場悄無聲息的大變革,到底藏著啥門道!
![]()
咱先掰扯清楚:馮諾依曼架構(gòu)為啥在AI面前就失靈了?
這老架構(gòu)的核心就是“排隊(duì)干活”——先取指令、再解碼、最后執(zhí)行,一步一步來,像老式流水線似的。以前跑個(gè)Word、玩?zhèn)€單機(jī)游戲,這套邏輯賊好用,簡單好造還便宜。
可AI不吃這一套啊!AI靠的是矩陣運(yùn)算,講究的是“千軍萬馬一起上”,就像工地上幾十人同時(shí)搬磚;而馮諾依曼架構(gòu)就像個(gè)慢動作老工人,只能挨個(gè)搬,效率低到離譜。
更坑的是“內(nèi)存墻”這個(gè)死穴。計(jì)算單元和內(nèi)存是分開的,每次運(yùn)算都得把數(shù)據(jù)從內(nèi)存搬到計(jì)算單元,算完再搬回去,來回折騰既耗時(shí)又耗電。
咱舉個(gè)例子,一個(gè)500億參數(shù)量的大模型,一次推理要上千億次運(yùn)算,光數(shù)據(jù)搬運(yùn)的時(shí)間就占了八成以上!
就算是最先進(jìn)的GPU,也逃不過這個(gè)坑。要么被DRAM的低速拖后腿,要么被SRAM的小容量卡住脖子,性能和功耗就像魚和熊掌,根本沒法兼顧。
![]()
2025年的數(shù)據(jù)顯示,傳統(tǒng)芯片處理AI任務(wù)時(shí),能耗浪費(fèi)率高達(dá)90%以上——相當(dāng)于花100塊電費(fèi),真正用在計(jì)算上的還不到10塊!
更關(guān)鍵的是,AI需求還在瘋漲:邊緣設(shè)備要跑更大的模型,數(shù)據(jù)中心要扛住萬億次運(yùn)算,馮諾依曼架構(gòu)那點(diǎn)小修小補(bǔ)的改進(jìn),早就跟不上趟了。就像用自行車追高鐵,再怎么蹬也沒用!
老架構(gòu)不行,新方案自然就冒了出來。最近兩年,模擬計(jì)算芯片突然異軍突起,直接顛覆了傳統(tǒng)思路,堪稱AI芯片的“救星”。
我跟你講,這模擬計(jì)算最牛的地方,就是把計(jì)算和存儲揉在一塊——不再需要來回搬運(yùn)數(shù)據(jù),直接在內(nèi)存里完成運(yùn)算,相當(dāng)于把“車間”和“倉庫”建在同一個(gè)屋檐下,從根上解決了“內(nèi)存墻”問題。
美國Ambient Scientific公司的GPX系列芯片,就是這波模擬計(jì)算的尖子生。它用了獨(dú)創(chuàng)的DigAn技術(shù),打造出模擬MAC單元,一個(gè)單元就把傳統(tǒng)架構(gòu)里ALU和存儲的活全攬了,效率直接拉滿。
![]()
關(guān)鍵數(shù)據(jù)來了,咱直接上干貨:處理一個(gè)32層的神經(jīng)網(wǎng)絡(luò)矩陣,傳統(tǒng)芯片要123萬多個(gè)時(shí)鐘周期,而GPX芯片只需要32個(gè)周期!
性能比同功耗的MCU高100多倍,能耗卻不到傳統(tǒng)GPU的1%——這差距,就像電動車和燃油車比續(xù)航!
截至2025年底,GPX系列已經(jīng)推出了GPX10和GPX10 Pro兩款產(chǎn)品。
其中GPX10 Pro集成了10個(gè)MX8 AI核心,峰值算力達(dá)512 GOPs,靠一顆紐扣電池就能讓設(shè)備持續(xù)跑AI推理,預(yù)計(jì)2026年第一季度就能量產(chǎn)。
以后智能手表測心率、安防攝像頭識人臉,再也不用頻繁充電了!
更貼心的是,它還兼容TensorFlow、PyTorch這些主流框架,工程師不用重新學(xué)新技術(shù),就能直接上手開發(fā),大大降低了落地門檻。這種“好用又省心”的芯片,妥妥的行業(yè)新寵!
![]()
當(dāng)然,模擬計(jì)算不是唯一的玩家,芯片巨頭們也都在全力沖刺,生怕被甩在后面。英偉達(dá)就亮出了全新的Vera Rubin超級芯片,直接把推理性能卷到了新高度。
在2025年的GTC大會上,黃仁勛拿出的這款“殺器”, Vera Rubin NVL144平臺的FP4推理算力達(dá)3.6 Exaflops,是上一代產(chǎn)品的3.3倍——簡單說,以前要算3天的任務(wù),現(xiàn)在1天就能搞定!
英偉達(dá)還放了大招,規(guī)劃了清晰的路線圖:2026年下半年推出NVL144平臺,2027年再上Rubin Ultra NVL576,推理算力直接沖到15 Exaflops,是現(xiàn)有產(chǎn)品的14倍!
更狠的是,他們還推出了推理專用的Rubin CPX,成本只有標(biāo)準(zhǔn)平臺的四分之一,直接把大模型部署的門檻砍到了地板價(jià)。
另一邊,英特爾也沒閑著。2025年11月,英特爾在重慶的技術(shù)大會上,亮出了最新的18A制程技術(shù),直接把晶體管尺寸做到了1.8納米(18埃米)。
![]()
用英特爾高管的話說,1納米相當(dāng)于頭發(fā)絲直徑的五萬分之一,1埃米就是再把這五萬分之一細(xì)分10份,堪稱“納米級繡花”!
基于18A制程的Panther Lake處理器,已經(jīng)進(jìn)入量產(chǎn)階段,這款A(yù)I原生處理器的算力高達(dá)180TOPS,相同功耗下多核性能提升50%,還能支持800億參數(shù)的大模型,首詞響應(yīng)時(shí)間縮短到30秒內(nèi)。
說句實(shí)在話,現(xiàn)在的芯片行業(yè)早就不是單點(diǎn)突破了。模擬計(jì)算主攻低功耗邊緣場景,英偉達(dá)領(lǐng)跑高端數(shù)據(jù)中心,英特爾靠18A制程搶占AI PC市場,形成了各占一塊地盤的互補(bǔ)格局。
2025年全球芯片市場,僅模擬計(jì)算細(xì)分領(lǐng)域就新增了300億美元規(guī)模,這賽道有多火,不用我多說了吧?
![]()
馮諾依曼這老伙計(jì),該給新勢力騰地方了!AI芯片的戰(zhàn)場,早就不是比誰跑得更快,而是比誰的架構(gòu)更對路、能效更能打。從模擬計(jì)算的能效革命,到18A制程的納米突破,再到巨頭們的算力狂飆,最終受益的都是整個(gè)AI產(chǎn)業(yè)。未來幾年,隨著這些新技術(shù)量產(chǎn)落地,智能駕駛、工業(yè)物聯(lián)網(wǎng)、多模態(tài)大模型都會迎來爆發(fā)。要知道,未來五年智算中心融資需求高達(dá)5到7萬億美元,沒點(diǎn)真本事的芯片,根本拿不到入場券。這場架構(gòu)革新的盛宴,咱們就搬好小板凳慢慢看!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.