《科創板日報》4月20日訊(記者 敖瑾)在推理拐點敘事持續強化的背景下,圍繞推理效率的算力架構出現分化,一批嘗試重構算力架構的初創公司也隨之開始浮出水面。
近日,LPU初創企業元川微宣布完成數億元天使輪系列融資,參與投資方包括元禾原點、峰瑞資本、中芯聚源、深創投、東方嘉富、浙江省科創母基金以及上市公司星宸科技、智微智能等多元投資平臺。公司方面表示,本輪融資資金將主要用于第一代LPU+架構AI推理芯片的研發與量產。
LPU架構進入主流視野,很大程度上源于Groq的快速崛起。作為專注推理算力的代表性公司,Groq在低時延、高吞吐及能效上的表現,引發市場對通用算力路徑之外技術路線的重新審視。
2025年下半年,英偉達豪擲200億美元,實質性整合了Groq的推理技術資產。到了今年3月,黃仁勛在GTC大會上展示了這項交易的最新成果:Groq的LPU架構已被深度集成到英偉達的Vera Rubin平臺中,提供面向Agent的實時推理算力。
在產業龍頭的領銜押注下,圍繞推理場景的算力架構重構,正在從邊緣探索走向產業前臺。
華為芯片老兵押注LPU架構
元川微成立于2025年9月,創始人楊濱此前任職于華為,曾在2008年赴美組建華為處理器團隊,2012年回國后主導華為無線基帶算法與芯片部門。
楊濱在一檔播客中曾表示,他早前已看好LPU這一架構路徑,但直到2025年初DeepSeek-R1技術報告發布,才真正堅定了下場創業的決心。“論文給我觸動極大,大模型終于不是泡沫了,可用了。 模型能力很強,成本降到了大家可以使用的階段。那天晚上我把論文看完,覺得終于可以下場了。”
LPU通常指面向大模型推理場景設計的專用架構,其核心在于通過優化數據流、存儲與調度方式,讓數據在芯片內部“少繞路”,同時減少運行過程中的動態調度,從而提升響應速度并降低能耗。
落地到產品側,元川微目前的規劃是,擬面向不同推理場景進行分層布局,包括面向數據中心和高端邊緣節點的推理芯片,強調高性能、復雜場景;以及面向大端側和邊緣側的推理方案,更側重連接能力以及面向行業場景的功能適配
這一規劃來自于團隊對推理需求本身變化的判斷。“短期內推理需求仍將主要集中在數據中心及部分邊緣節點,但隨著Agent、具身智能等應用逐步落地,推理負載將持續向終端側延伸,邊端有望成為下一階段的重要增長點。”楊濱對《科創板日報》記者表示。
據公司方面介紹,元川微目前仍處于研發階段,已完成系統仿真、原型驗證及FPGA驗證,下一步將推進產品定義、客戶對接以及軟件生態與工具鏈建設,并計劃于明年上半年完成投片。
值得一提的是,在仍處于研發階段的情況下,元川微即獲得了多方資本加持。其近期官宣的天使輪系列融資,就集結了頭部財務投資機構、政府投資平臺以及上市公司等的參與,包括中芯聚源、深創投、東方嘉富、元禾原點、峰瑞資本、浙江省科創母基金、杭州潤苗基金以及星宸科技、智微智能等。
對于產業方在公司早期階段的押注,楊濱對《科創板日報》記者表示,兩家上市公司股東一定程度上分別代表了不同的市場切入方向,一個深耕算力中心,一個布局大端側與邊緣側,與元川微的產品分層邏輯契合,因此它們兼具了股東和客戶的身份,“產業方目前在產品定義、供應鏈和早期市場上都給了元川微實際的支持。”楊濱進一步表示,產業方更看重的是系統方案落地后,能否真正改善每瓦特性能與每token成本,“賬能算回來,他們才會投。”
算力變局下的產業機遇
在楊濱看來,LPU架構的興起,更本質的原因在于算力需求結構的變化。
他認為,當前算力消費的主體已經發生變化,“簡單的碳基消費者,變成了碳基和硅基混合的消費模式。”也就是說,算力的調用方已經不只是人,還有Agent。
而這一變化帶來的不只是量的壓力。人與AI對話每秒不過幾十個token,但Agent之間協同時交互量可能是這個數字的十倍乃至百倍,因此,現在階段的推理基礎設施,在每用戶每秒的token提供能力、每token的成本、每token的能耗上,都和滿足實際需求存在巨大差距。”楊濱據此判斷,推理算力的基礎設施,正處于一個重構的轉折點。
值得一提的是,黃仁勛也在近期的公開表態中,持續強調推理拐點來臨后,算力評價體系的重構,推理算力逐漸從附屬環節走向核心環節。標志性的體現就是,成立了9年的Groq,因為英偉達一筆高達200億美元的整合性收購,驟然站在了AI行業的聚光燈下。
不過,僅從國內來看,真正意義上以LPU為核心路線的企業仍屬少數。
目前,多數AI芯片公司仍沿GPU或通用算力路徑推進,通過兼顧訓練與推理提升性能;包括元川微、邁特芯、深明奧思等少數幾家企業,正在嘗試以推理為中心重新設計架構,屬于尚未形成共識的探索方向。
這一格局的形成,與技術路徑選擇及產業階段密切相關。一方面,相較在既有架構上進行優化,從推理場景出發重新設計芯片架構,對系統設計能力與工程積累提出更高要求;另一方面,推理需求雖在快速增長,但其具體應用形態仍在演進之中,產業側對新架構的接受度仍有待進一步驗證。楊濱亦在采訪中對《科創板日報》記者坦言,工藝制程與先進IP的制約是繞不開的門檻,而在產業共識尚未形成的早期,愿意理解這條路線的人本就不多。
不過他也表示,推理場景相較訓練,對現有軟件生態的依賴要低得多,這種相對寬松的生態約束,對國內推理芯片的創業者而言事實上是一個窗口機遇。
值得一提的是,從更廣泛的行業視角來看,推理算力的興起,已經為更多產業鏈環節帶來了結構性機會。
隨著token消耗提升,對算力密度、帶寬及能效的要求同步上升,除了芯片架構層面,這一趨勢的影響也在向上游硬件體系傳導,帶動包括服務器互聯、PCB及高速材料等環節的需求提升。可以看到,相關上市公司在過去一段時間股價已經經歷了一輪陡峭上升,資金對這一方向的關注度持續提升。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.