我們正在進入一個生成式AI加速普及的新時代。今年8月,國務院下發了《關于深入實施“人工智能+”行動的意見》,其中重點提到要盡快實施“人工智能+”產業發展,培育智能原生新模式新業態,推進工業全要素智能化發展,加快農業數智化轉型升級,創新服務業發展新模式。
前不久,知名研究機構IDC做了一個非常樂觀的預測:2025-2029年,預計中國生成式AI市場的復合增長率將高達47.9%,大大高于同期GDP的增長率;2029年,市場規模將達到457.6億美元。
高速增長的AI市場,需要更加堅實的AI基礎設施。前不久發布的《中國人工智能應用發展報告(2025)》認為,未來十年,AI 的發展可能需要100萬倍的算力支撐。
如何保證充足的AI基礎設施供應?在12月5日北京舉行的“異構智算 本地引擎”2025聯想異構智算產業聯盟高峰論壇暨AI算力基礎設施新品發布會上,聯想集團副總裁、中國基礎設施業務群總經理陳振寬給出了關鍵答案——“聯想AI工廠”。
![]()
聯想集團副總裁、中國基礎設施業務群總經理陳振寬
智算中心呼喚AI工廠
“AI工廠”最早由Marco Iansiti和Karim R. Lakhani 在2020年出版的《AI時代的競爭》中提出,它通過緊密集成計算、存儲和網絡元素,為人工智能工作負載優化整個系統,使人工智能的使用具有操作性。
![]()
AI工廠之所以被稱為“工廠”,是因為它與物理工廠相似,只不過物理工廠生產的是物理產品,而AI工廠生產的則是智能,我們能夠利用這些智能操作AI模型、IT系統和其他資產。
我們為什么需要AI工廠?因為要支持高速發展的生成式AI,就需要全新的智算數據中心(AIDC),而傳統數據中心已經力不從心。
兩種數據中心的對比
![]()
雖然我們迫切需要全新的智算數據中心,可是產業界卻并沒有做好準備。
以上表中的“計算架構”為例,在采用全互聯對等架構的智算數據中心當中,不再是CPU統攬全局調動四方,而是需要多達幾種甚至十幾種不同處理器(CPU/GPU/xPU)的直接通信。在強調自主創新的中國,處理器的類型尤其多樣,這個問題也更為明顯,而之前卻并還沒有一個很好的解決方案。
再比如,隨著AI應用的大發展,使得南京大學等高等院校的科研項目從以CPU為主的科學計算,轉向以深度學習和AI大模型為主的科學智能計算。但是,由于GPU服務器的成本遠高于CPU服務器,南京大學在數據中心擴容升級的時候,仍然只能以CPU計算節點為主,而這能否滿足南京大學長期的科研需求,仍然是個問題。
而且,伴隨著過去二十多年互聯網的大發展,傳統數據中心的建設、運維已經形成了一整套非常成熟高效的模式。你會發現,與已經采用“現代化大工廠”模式的傳統數據中心相比,智算數據中心的建設和運維仍然還是“手工小作坊”模式。
![]()
因此,我們迫切需要智算數據中心的“工廠化”。此次推出的“聯想AI工廠”解決方案,就是要構建一套可管理、可復制且支持持續運營的標準化體系,重塑AI應用的開發與部署流程,將原本復雜且孤立的AI開發任務轉變為標準、高效的現代化“AI生產線”。
具體到智算數據中心,聯想已經成功搭建了“一橫四縱”的戰略布局。下面,老冀就給大家做個詳細解讀。
“樂高”服務器
聯想的“一橫四縱”中的“一橫”是萬全異構智算方案,“四縱”則是服務器、存儲、數據網絡、軟件及超融合。其中,服務器可謂“縱”中之“重”。
在12月5日的發布會上,聯想發布了堪稱“核武級”的首款高端大模型訓練AI服務器——聯想問天 WA8080a G5新品。
談起這款新品最大的特點,聯想中國基礎設施業務群服務器事業部總經理周韜認為,是為了滿足客戶的多樣化需求而倒逼出來的模塊化設計。
![]()
聯想中國基礎設施業務群服務器事業部總經理周韜
周韜和他的團隊發現,過去設計一個新的服務器產品,基礎架構定下來以后,可以沿用好幾代。而現在,AI技術發展實在是太快了,剛過一年,原來的架構就不能支持新的發展了。
為此,這次在聯想問天WA8080a G5上,他們直接把機箱加到了10U,能夠支持超過1000瓦的單GPU。要知道,目前單GPU的功耗基本上也就是在500-600瓦的水平,10U將能夠支持未來兩代甚至更多代產品的功耗。
聯想問天WA8080a G5的CPU主板、GPU主板以及中間背板,都做成了模塊化的組件,盡量讓這些模塊互相能夠通用,從而降低了重新開發組件的成本。
這款AI服務器還構建了高效靈活的“1+3+N”,也就是采用1個系統架構,兼容3種不同的CPU,還兼容多家廠商的GPU,只要它們支持主流的OAM2.0。這就在很大程度上適應了國內市場特別是信創相關的需求:畢竟,國內市場上,AI服務器的GPU供應商除了英偉達等國際廠商之外,還有諸多國產廠商。
有了“1+3+N”架構和模塊化設計,聯想問天 WA8080a G5就能夠快速滿足國內企業客戶由于采用不同芯片導致的不同需求。無論是哪家廠商的GPU,只要符合OAM2.0標準,直接放進機架里就能做適配,極大地降低了服務器的適配時間。
此外,聯想問天WA8080a G5還同時兼顧風冷和液冷雙模散熱方案,有著極強的適應能力。
這樣的服務器,是不是有點像通過不同組件的自由組合、創造出千變萬化造型的“樂高”?
有了“樂高”服務器作為主力,再加上同樣能夠靈活配置的存儲、數據網絡、軟件及超融合產品,共同組成完整的AI基礎設施,聯想為“AI工廠”打下了穩固的支柱。
算無遺“場景”,才“萬全”
打造AI工廠,光有穩固的支柱當然不夠,還需要同樣穩固的屋頂,而且這個屋頂還要適應各種不同的支柱組合。這個屋頂,就是聯想打造的“一橫”:聯想萬全異構智算平臺(以下簡稱“萬全平臺”)。
聯想中國基礎設施業務群戰略管理總監黃山表示,自從去年4月誕生的第一天起,萬全平臺就在不斷加大對AI原生技術棧的支持力度、廣度和深度。
![]()
聯想中國基礎設施業務群戰略管理總監黃山
萬全平臺1.0和2.0發布的時候,AI的算力瓶頸主要還是集中在預訓練領域,因此,黃山帶領的萬全平臺團隊把主要優化方向放在了提升底層算力上面,實現了20-30%的訓練效率提升。
去年12月,DeepSeek橫空出世,一口氣發布了DeepSeek-V3基座大模型、DeepSeek-R1推理模型、Janus-Pro多模態大模型,達到了OpenAI同類型模型的同等水平,訓練成本卻只有5%,運行成本更是只有3%。更重要的是,DeepSeek還公開了模型訓練中對于算力優化的方式和方法。
萬全平臺團隊發現,DeepSeek的很多方法都能夠用在推理上。在今年5月發布的萬全平臺3.0中,他們新增了AI推理加速算法集、AI編譯優化器、AI訓推慢節點故障與自愈系統、專家并行通信算法四大突破性創新技術,直擊大模型應用落地的關鍵痛點,并為DeepSeek R1/V3等千億級大模型提供更高效的運行環境,不斷突破算力效率極限。
他們也花了不少精力去解決國產GPU適配的難題。“今年上半年,我們廣泛、徹底地把國產GPU給跑起來了。”黃山透露。
而這次發布會上推出的萬全平臺4.0,又解決了四大AI場景中的諸多難題。
第一個是預訓練場景。如今的大模型,需要訓練的文章越來越長,已經出現了六七萬字甚至20萬字的文章,產生了128K的長序列。長序列的預訓練需要大負載,需要并行策略的優化。萬全4.0通過長序列并行優化,模型訓練時間可縮短35%。
第二個是后訓練場景。大模型正在加緊從單純的語言向多模態發展。由于每種模態向量計算的算法都不一樣,要調的算力不一樣,出來的Token也不一樣,這就需要進行不同類型Token之間的匹配。萬全4.0針對通義千問等主流大模型專門做了計算引擎優化、小樣本強化學習、訓練自動并行,可使訓練時間縮短50%。
第三個是推理場景。大模型也正在從訓練轉向推理,大規模、高并發的推理,需要高速網絡的支持。如今,RoCE網絡得到了眾多廠商的支持,正在成為主流。但是,如果不做負載均衡的話,RoCE網絡的帶寬利用率會呈現指數級下滑,而且用傳統負載均衡解決不了。萬全4.0打造了一套RoCE網絡專用的負載均衡優化方案,將帶寬利用率提升了60%,通信原語性能提升30%,大模型推理性能提升30%。
第四個是超智融合計算場景。之前,國內已經建成了不少的超算中心,如今大規模轉向智算中心,如何將過去的投資利用起來?聯想首先在吉利汽車做了超智融合的實踐,取得了不小的成果,實現了兩者的算法融合。萬全4.0可支持國際和國內硬件生態,完成從底層架構到算子的全面優化,同時新增超16個制造業應用的作業模版和腳本,實現高效超智融合。
![]()
黃山表示,萬全4.0已經為眾多算力場景提供全面支持:在國家級高質量AI集群場景中,聯想與東數西算第一大智算樞紐緊密合作,在千卡訓練場景中將MFU從30%提升至60%;針對模型本地部署的企業AI基礎設施場景,全速運轉滿血版DeepSeek R1模型極限吞吐量已經超越12000 Tokens/s,不斷刷新性能行業記錄。在高校科研場景中,聯想助力北京大學建設多模態跨尺度生物醫學成像設施科研場景HPC/AI融合算力管理平臺,持續穩定地輸出算力,并不斷地突破計算效率。
訓推服務做“標兵”
有了“一橫四縱”,一家合格的樣板“AI工廠”算是建立起來了。不過,聯想覺得這仍然不夠,如果能夠把“AI工廠”的建設過程總結成手冊和標準,以后再建千家萬家的“AI工廠”,不就容易了許多?
正是基于這個目的,在這次大會上,聯想還攜手眾多產業伙伴,重磅發布了業內首個模型訓推服務標準《信息技術算力服務高性能訓推服務能力要求》驗證成果。
![]()
聯想作為主編單位,全程參與了標準制定過程。據了解,制定此標準意在為高性能模型訓推服務建立統一的能力標尺,此舉有利于規范服務市場、牽引技術升級,降低各行業AI應用門檻,推動算力服務從“資源交付”向標準化、高質量的“能力交付”演進,從而加速智能化轉型。
中國電子技術標準化研究院軟件應用與服務研究中心云計算研究室主任陳志峰認為,該標準的核心價值在于彌補業界高性能訓推服務能力規范標準空白,既為企業提供統一架構參考,更推動AI生產從零散探索走向標準化、規模化,加速行業智能化轉型。
![]()
中國電子技術標準化研究院軟件應用與服務研究中心云計算研究室主任陳志峰
作為該標準的主編單位和核心貢獻者,聯想并非僅僅是規則的制定者,更是率先的實踐者與驗證者。其發布的驗證成果,全面展示了其AI服務器、萬全異構智算平臺在滿足并超越該標準要求方面的卓越能力。
在異構算力調度與一體化范式方面,聯想的智能算力平臺成功驗證了標準的統一抽象與調度要求,實現了訓練與推理任務的資源共享與無縫流動。
在通信網絡優化方面,通過集成先進的在網計算技術和自研的RoCE網絡自動化調優系統,驗證了標準中對無損網絡和通信性能的嚴苛指標,實現了高性能網絡的“開箱即用”。
在高性能推理方面,聯想基于其推理引擎,成功部署并驗證了PD分離架構與KV-Cache優化技術,在復雜模型上實現了吞吐量與響應時間的顯著優化,完全符合標準對SLA保障的要求。
該標準的制定與驗證成果的發布,為滿足高性能訓推的算力服務質量提供了統一的衡量標準,有助于規范性能指標和服務質量,并指引算力基礎設施與服務商向體系化、高性能、高可靠的方向演進,推動整體產業升級。
AI工廠推動AI普惠
正是因為此前在AI原生技術棧上已經有了豐富的積累,再加上“一橫四縱”戰略的加速實施,雖然聯想剛剛發布“聯想AI工廠”整體解決方案,但是其中的很多產品和解決方案,已經在企業中得到了成功驗證。
舉個典型的例子。隨著人工智能大模型的發展,南京大學的高性能計算中心開戶課題組已經不僅僅是來自傳統的化學化工、大氣科學、地球科學、物理學院等傳統理工科“算力消耗大戶”,也有來自商學院、社會學院等相關文科學院的研究課題。由此,南京大學高性能計算中心也將會從傳統的科學計算中心,逐步演進為科學智能計算中心。
作為核心供應商的聯想,已經做好了準備。為了幫助南京大學應對高性能計算集群與智能計算機群并存的局面,聯想萬全易購智算平臺可以統一納管異構算力,能夠更好地應對超制融合的管理挑戰,實現HPC集群與智能計算機群統一的管理和調度。
除了南京大學之外,聯想也為北京大學、上海交通大學、南方科技大學等數十所高校打造了高性能計算平臺和智算平臺。
再舉個例子。今年2月,愛爾眼科與聯想合作,率先在行業內實現了本地部署DeepSeek滿血版大模型并引入聯想萬全AI一體機方案。愛爾眼科數字人“愛科”(Eyecho)正式升級接入DeepSeek-R1推理模型,實現智能問答、醫學科普及患者互動的精準性與效率提升,用戶體驗全面優化。
在AI基礎設施的部署上,聯想就采納了“AI工廠”的理念。聯想萬全AI一體機基于聯想問天 WA7780 G3 AI大模型訓練服務器,內嵌Transformer Engine,支持高達100并發。聯想萬全AI一體機還憑借軟硬件的深度適配,大幅簡化了DeepSeek大模型的部署流程。
此外,聯想萬全AI一體機搭載8張96G顯存高性能GPU,并支持FP8優化,單機可部署671B參數的DeepSeek-R1滿血版大模型,并可通過兩臺集群部署FP16量化模型,滿足更復雜的AI應用需求。FP16精度更高,能更精準地處理知識庫內容,確保答案的準確性和專業性。
從聯想此前的諸多AI成功實踐也可以看出,“聯想AI工廠”順應了企業的需求,也符合我們這個時代的要求,可謂前景廣闊、大有可為。
![]()
如今,AI工廠已經成為全球產業界的共識。就在今年6月巴黎GTC大會上,英偉達創始人兼首席執行官黃仁勛發表主題演講,宣布將在德國建設全球首個工業人工智能云設施“AI工廠”,“在人工智能時代,每個制造商都需要兩個工廠:一個用于制造產品,另一個用于創造驅動這些產品的智能。”
全球范圍內,各國政府與企業都在競相建設AI工廠,以刺激經濟增長、促進創新并提升效率。歐洲高性能計算聯合體(EuroHPC JU)近期宣布,計劃與 17 個歐盟成員國攜手打造 7 座 AI 工廠。
工業時代,一個國家的整體實力可以用鋼產量來衡量,需要效率很高的鋼鐵廠;AI時代,國家的競爭力則可以用其生成的智能體、垂域模型、推理服務的數量來評價,而這就需要高效率的AI工廠。
如今的聯想正在加緊打造更多高效率的AI工廠,成為AI普惠的重要推手,為加速實施“人工智能+”提供原動力。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.