2025年12月26日,極新主辦的【想象·2025極新AIGC峰會】在上海浦東浦軟大廈成功召開。金山云公有云事業部解決方案架構師宋燁先生在會上發表題為《大模型技術演進與想象力引擎構建》的重要演講,分享大模型技術發展趨勢與普惠算力實踐。
![]()
金山云公有云事業部解決方案架構師宋燁
宋燁重點提到以下幾點:
“效率革命是提升社會工作效率的關鍵”
“公有云的本質是解放客戶生產力”
“普惠算力讓AI匯集到千行萬業”
以下為宋燁演講全文,經極新整理:
各位早上好!我是金山云解決方案架構師團隊負責人宋燁,今天非常榮幸能有機會,與大家分享 AIGC 浪潮下金山云的實踐探索,以及行業與技術的發展趨勢。本次匯報主題為《大模型技術演進與想象力引擎構建》。
01效率革命與AI驅動
“效率革命是提升社會工作效率的關鍵”
首先要提出“效率革命”這一核心概念。用經濟學公式可對人均 GDP(衡量國民生活幸福程度的重要參考指標)進行拆解:人均GDP=GDP÷總人口,進一步迭代為(GDP÷工作人口)×(工作人口÷總人口)。
隨著社會發展,等式右側“工作人口÷總人口”的比值正持續下降,我國面臨老齡化加劇、出生人口低迷的現狀,未來這一趨勢難以逆轉。因此,提升人均GDP的唯一路徑,就是提高“GDP÷工作人口”的比值,這一數值本質上就是國家整體生產效率。AIGC 的誕生與發展,核心作用正是提升社會工作效率,這也是中美等世界主要國家爭相在 AIGC 領域加大資源投入的根本原因,目前中美已成為該領域最發達的兩個國家。
基于這一判斷,金山云領導層堅定認為 AIGC 是必須布局的核心賽道。早在三年前,公司CEO就提出“奧運 AI”戰略口號,始終踐行相關發展目標。人工智能雖已發展多年,但自Transformer等傳統模型提出后,行業迎來爆發式增長,吸引了大量投資與技術跟進。
金山云始終緊跟行業浪潮,技術布局與上述方向高度契合,主要聚焦三大核心工作:其一,基座模型研發支持。2023-2024年基座模型是熱門投資方向,金山云前兩年重點為基座模型廠商提供大規模算力支持,這一過程極具挑戰性;
其二,融合感知技術研發,即多模態技術。除語言研究外,進一步覆蓋視覺、聽覺等人類核心感知維度,而視覺感知尤為重要。眾多知名科學家提出,語言無法完美描述世界,例如模型對“重力”等物理世界的感知存在欠缺,需通過視覺等多模態能力彌補,當前世界模型的研究已在機器人、自動駕駛等領域廣泛開展;
其三,普惠化落地探索。核心目標是讓AI算力與技術惠及千行萬業。對于初創企業等成本敏感型主體而言,GPU算力投入門檻極高,金山云正致力于降低AI工具使用門檻,助力各類主體快速運用AI實現創新突破。
02算力集群構建挑戰
“公有云的本質是解放客戶生產力”
首先要明確公有云的核心本質:解放客戶生產力。客戶無需在基礎架構上投入精力,可將全部資源集中于核心業務創新,把基礎架構相關的技術工作交由公有云承接,這正是公有云的核心價值。也正因如此,在AI爆發的這幾年,公有云服務了大量客戶,行業內國內外相關企業的股價均表現亮眼,金山云也不例外。
接下來重點分享金山云在算力集群領域的實踐。過去三年,我們持續投入大量精力構建算力集群,而大模型的工程落地并非簡單采購機器即可,中間涉及復雜的實施過程,需滿足高性能、高帶寬、高存儲等多重需求。
在網絡構建階段,工程師曾為避免光纖在運輸中沾染灰塵,用酒精棉簽擦拭,卻導致集群構建后信號抖動嚴重,酒精蒸發后殘留的痕跡會影響信號傳輸;在硬件部署層面,GPU服務器功耗極高,傳統機柜適配性差,部分機柜僅能容納一臺機器,運行時的嘯叫堪比飛機起飛,且對散熱要求嚴苛。
更具挑戰的是機房空間問題:客戶常需從256臺擴展至512臺規模,但多數機房難以滿足需求,被迫搬家時還需規避北方冬季的冷凝水風險,低溫環境運輸的機器進入高溫機房后,極易產生冷凝水,嚴重影響設備壽命。此外,物理服務器選型、機房篩選等環節也面臨諸多考驗。
除物理層難題外,網絡組網方案的優化同樣關鍵。技術層面主要有兩種選擇:IB和ROCE。IB方案性能更優,但成本是ROCE的三倍。為此,金山云專門組建網絡團隊,持續迭代優化 ROCE 網絡性能,目前已實現接近IB的水平,這一過程中交換機系統等相關組件也在不斷升級,投入了大量技術資源。
至今,我們仍在持續承接超大規模算力集群項目,這些集群的核心用途是作為模型訓練的底座。為保障交付給客戶的環境穩定,我們對所有服務器選型進行嚴格篩選與檢測,交付前需經過數天的加電穩定性測試,覆蓋服務器、網絡等全環節。
03普惠算力實踐
“普惠算力讓AI匯集到千行萬業”
接下來重點分享當前我們聚焦的“普惠算力”相關實踐,核心圍繞 API 服務的落地與應用展開。先通過一張海外權威報告說明行業趨勢:海外頂尖 token 服務公司OpenRoad在2025年5月至11月的調研顯示,其平臺上各類模型調用需求中,“角色扮演(Role Play)”占比最高,這類應用涵蓋陪伴、情感陪護等場景;其次是代碼生成,此外技術、財務、學術、科學、法務、翻譯、健康等領域的需求也較為突出。
![]()
這里的API服務核心價值在于降低AI使用門檻:初創企業無需搭建復雜的算力集群,只需通過現成的AI API服務,即可調用各類先進模型,OpenRoad本質就是這樣的模型中轉站,而金山云也已同步布局該領域,面向用戶提供托管式及公有API服務。
我們的API服務布局分為兩大方向,背后對應不同的技術與運營團隊:一方面,金山云自主部署并調優市場上主流的開源模型,用戶通過公有云賬號即可直接訪問這些模型的API;另一方面,搭建模型中轉服務,對于未開源的商業API,用戶無法直接獲取模型部署權限,金山云作為中轉方對接原廠商,憑借海量客戶資源爭取更優合作價格,為此專門設立采購團隊與模型廠商洽談折扣,同時組建技術團隊保障開源模型的快速上線,實現“模型發布次日即可在平臺提供服務”的響應速度。
從技術架構來看,所有API服務提供商均需覆蓋資源層、平臺組件等核心模塊,而行業競爭的關鍵在于兩點:一是性價比,滿足用戶對低成本使用AI服務的需求;二是性能穩定性,通過KB/PB分離、TPP并行等優化算法,提升推理速度與服務可靠性,這也是金山云API服務的核心競爭力,更是普惠算力的重要落地方式。
實際應用中,AI API服務的用戶群體廣泛,有同事在出差途中與陌生人交流后,對方當場注冊金山云賬號并啟用API服務。目前我們已積累了各類行業用戶,其中包括國內多家知名大型模型廠商(作為中立云廠商,我們為其提供多元服務支持)。
值得一提的是,代碼生成是當前熱門賽道,金山云也針對性開發了內部研發工具。公司內部對該工具的使用極為重視,管理層已調研所有程序員的使用頻率,以此推動內部AI工具的深度應用。
結合網上的“AIGC適用度四象限圖”,不同場景的AI應用適配性存在差異:右上角“想象力優先”象限的應用最為廣泛;右下角代碼生成等賽道已有實際落地案例;左上角容錯率低的場景目前應用較少;左下角最嚴謹的領域則有部分企業主攻。而金山云的核心目標,正是為各領域用戶提供“助飛想象”的AI引擎。
![]()
最后,金山云為用戶提供完整的技術支持體系。最底層是基礎設施層,提供高性能算力集群。在此基礎上是AI平臺層,用戶可通過金山云調用各種市場常用模型。
目前我們的平臺支持近30種不同模型,包括Kimi、Deepseek等熱門模型,甚至一些海外模型。通過一站式訪問渠道,用戶能專注于業務創新。
總之,金山云始終致力于從技術底座層面幫助用戶實現想象力,推動AI技術在各行各業的落地應用。
更多干貨分享敬請注我們的公眾號與視頻號~超多精彩對話內容等待您的解鎖!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.