2025年12月26日,極新主辦的【想象·2025極新AIGC峰會(huì)】在上海浦東浦軟大廈成功召開。金山云公有云事業(yè)部解決方案架構(gòu)師宋燁先生在會(huì)上發(fā)表題為《大模型技術(shù)演進(jìn)與想象力引擎構(gòu)建》的重要演講,分享大模型技術(shù)發(fā)展趨勢(shì)與普惠算力實(shí)踐。
![]()
金山云公有云事業(yè)部解決方案架構(gòu)師宋燁
宋燁重點(diǎn)提到以下幾點(diǎn):
“效率革命是提升社會(huì)工作效率的關(guān)鍵”
“公有云的本質(zhì)是解放客戶生產(chǎn)力”
“普惠算力讓AI匯集到千行萬(wàn)業(yè)”
以下為宋燁演講全文,經(jīng)極新整理:
各位早上好!我是金山云解決方案架構(gòu)師團(tuán)隊(duì)負(fù)責(zé)人宋燁,今天非常榮幸能有機(jī)會(huì),與大家分享 AIGC 浪潮下金山云的實(shí)踐探索,以及行業(yè)與技術(shù)的發(fā)展趨勢(shì)。本次匯報(bào)主題為《大模型技術(shù)演進(jìn)與想象力引擎構(gòu)建》。
01效率革命與AI驅(qū)動(dòng)
“效率革命是提升社會(huì)工作效率的關(guān)鍵”
首先要提出“效率革命”這一核心概念。用經(jīng)濟(jì)學(xué)公式可對(duì)人均 GDP(衡量國(guó)民生活幸福程度的重要參考指標(biāo))進(jìn)行拆解:人均GDP=GDP÷總?cè)丝冢M(jìn)一步迭代為(GDP÷工作人口)×(工作人口÷總?cè)丝冢?/p>
隨著社會(huì)發(fā)展,等式右側(cè)“工作人口÷總?cè)丝凇钡谋戎嫡掷m(xù)下降,我國(guó)面臨老齡化加劇、出生人口低迷的現(xiàn)狀,未來這一趨勢(shì)難以逆轉(zhuǎn)。因此,提升人均GDP的唯一路徑,就是提高“GDP÷工作人口”的比值,這一數(shù)值本質(zhì)上就是國(guó)家整體生產(chǎn)效率。AIGC 的誕生與發(fā)展,核心作用正是提升社會(huì)工作效率,這也是中美等世界主要國(guó)家爭(zhēng)相在 AIGC 領(lǐng)域加大資源投入的根本原因,目前中美已成為該領(lǐng)域最發(fā)達(dá)的兩個(gè)國(guó)家。
基于這一判斷,金山云領(lǐng)導(dǎo)層堅(jiān)定認(rèn)為 AIGC 是必須布局的核心賽道。早在三年前,公司CEO就提出“奧運(yùn) AI”戰(zhàn)略口號(hào),始終踐行相關(guān)發(fā)展目標(biāo)。人工智能雖已發(fā)展多年,但自Transformer等傳統(tǒng)模型提出后,行業(yè)迎來爆發(fā)式增長(zhǎng),吸引了大量投資與技術(shù)跟進(jìn)。
金山云始終緊跟行業(yè)浪潮,技術(shù)布局與上述方向高度契合,主要聚焦三大核心工作:其一,基座模型研發(fā)支持。2023-2024年基座模型是熱門投資方向,金山云前兩年重點(diǎn)為基座模型廠商提供大規(guī)模算力支持,這一過程極具挑戰(zhàn)性;
其二,融合感知技術(shù)研發(fā),即多模態(tài)技術(shù)。除語(yǔ)言研究外,進(jìn)一步覆蓋視覺、聽覺等人類核心感知維度,而視覺感知尤為重要。眾多知名科學(xué)家提出,語(yǔ)言無(wú)法完美描述世界,例如模型對(duì)“重力”等物理世界的感知存在欠缺,需通過視覺等多模態(tài)能力彌補(bǔ),當(dāng)前世界模型的研究已在機(jī)器人、自動(dòng)駕駛等領(lǐng)域廣泛開展;
其三,普惠化落地探索。核心目標(biāo)是讓AI算力與技術(shù)惠及千行萬(wàn)業(yè)。對(duì)于初創(chuàng)企業(yè)等成本敏感型主體而言,GPU算力投入門檻極高,金山云正致力于降低AI工具使用門檻,助力各類主體快速運(yùn)用AI實(shí)現(xiàn)創(chuàng)新突破。
02算力集群構(gòu)建挑戰(zhàn)
“公有云的本質(zhì)是解放客戶生產(chǎn)力”
首先要明確公有云的核心本質(zhì):解放客戶生產(chǎn)力。客戶無(wú)需在基礎(chǔ)架構(gòu)上投入精力,可將全部資源集中于核心業(yè)務(wù)創(chuàng)新,把基礎(chǔ)架構(gòu)相關(guān)的技術(shù)工作交由公有云承接,這正是公有云的核心價(jià)值。也正因如此,在AI爆發(fā)的這幾年,公有云服務(wù)了大量客戶,行業(yè)內(nèi)國(guó)內(nèi)外相關(guān)企業(yè)的股價(jià)均表現(xiàn)亮眼,金山云也不例外。
接下來重點(diǎn)分享金山云在算力集群領(lǐng)域的實(shí)踐。過去三年,我們持續(xù)投入大量精力構(gòu)建算力集群,而大模型的工程落地并非簡(jiǎn)單采購(gòu)機(jī)器即可,中間涉及復(fù)雜的實(shí)施過程,需滿足高性能、高帶寬、高存儲(chǔ)等多重需求。
在網(wǎng)絡(luò)構(gòu)建階段,工程師曾為避免光纖在運(yùn)輸中沾染灰塵,用酒精棉簽擦拭,卻導(dǎo)致集群構(gòu)建后信號(hào)抖動(dòng)嚴(yán)重,酒精蒸發(fā)后殘留的痕跡會(huì)影響信號(hào)傳輸;在硬件部署層面,GPU服務(wù)器功耗極高,傳統(tǒng)機(jī)柜適配性差,部分機(jī)柜僅能容納一臺(tái)機(jī)器,運(yùn)行時(shí)的嘯叫堪比飛機(jī)起飛,且對(duì)散熱要求嚴(yán)苛。
更具挑戰(zhàn)的是機(jī)房空間問題:客戶常需從256臺(tái)擴(kuò)展至512臺(tái)規(guī)模,但多數(shù)機(jī)房難以滿足需求,被迫搬家時(shí)還需規(guī)避北方冬季的冷凝水風(fēng)險(xiǎn),低溫環(huán)境運(yùn)輸?shù)臋C(jī)器進(jìn)入高溫機(jī)房后,極易產(chǎn)生冷凝水,嚴(yán)重影響設(shè)備壽命。此外,物理服務(wù)器選型、機(jī)房篩選等環(huán)節(jié)也面臨諸多考驗(yàn)。
除物理層難題外,網(wǎng)絡(luò)組網(wǎng)方案的優(yōu)化同樣關(guān)鍵。技術(shù)層面主要有兩種選擇:IB和ROCE。IB方案性能更優(yōu),但成本是ROCE的三倍。為此,金山云專門組建網(wǎng)絡(luò)團(tuán)隊(duì),持續(xù)迭代優(yōu)化 ROCE 網(wǎng)絡(luò)性能,目前已實(shí)現(xiàn)接近IB的水平,這一過程中交換機(jī)系統(tǒng)等相關(guān)組件也在不斷升級(jí),投入了大量技術(shù)資源。
至今,我們?nèi)栽诔掷m(xù)承接超大規(guī)模算力集群項(xiàng)目,這些集群的核心用途是作為模型訓(xùn)練的底座。為保障交付給客戶的環(huán)境穩(wěn)定,我們對(duì)所有服務(wù)器選型進(jìn)行嚴(yán)格篩選與檢測(cè),交付前需經(jīng)過數(shù)天的加電穩(wěn)定性測(cè)試,覆蓋服務(wù)器、網(wǎng)絡(luò)等全環(huán)節(jié)。
03普惠算力實(shí)踐
“普惠算力讓AI匯集到千行萬(wàn)業(yè)”
接下來重點(diǎn)分享當(dāng)前我們聚焦的“普惠算力”相關(guān)實(shí)踐,核心圍繞 API 服務(wù)的落地與應(yīng)用展開。先通過一張海外權(quán)威報(bào)告說明行業(yè)趨勢(shì):海外頂尖 token 服務(wù)公司OpenRoad在2025年5月至11月的調(diào)研顯示,其平臺(tái)上各類模型調(diào)用需求中,“角色扮演(Role Play)”占比最高,這類應(yīng)用涵蓋陪伴、情感陪護(hù)等場(chǎng)景;其次是代碼生成,此外技術(shù)、財(cái)務(wù)、學(xué)術(shù)、科學(xué)、法務(wù)、翻譯、健康等領(lǐng)域的需求也較為突出。
![]()
這里的API服務(wù)核心價(jià)值在于降低AI使用門檻:初創(chuàng)企業(yè)無(wú)需搭建復(fù)雜的算力集群,只需通過現(xiàn)成的AI API服務(wù),即可調(diào)用各類先進(jìn)模型,OpenRoad本質(zhì)就是這樣的模型中轉(zhuǎn)站,而金山云也已同步布局該領(lǐng)域,面向用戶提供托管式及公有API服務(wù)。
我們的API服務(wù)布局分為兩大方向,背后對(duì)應(yīng)不同的技術(shù)與運(yùn)營(yíng)團(tuán)隊(duì):一方面,金山云自主部署并調(diào)優(yōu)市場(chǎng)上主流的開源模型,用戶通過公有云賬號(hào)即可直接訪問這些模型的API;另一方面,搭建模型中轉(zhuǎn)服務(wù),對(duì)于未開源的商業(yè)API,用戶無(wú)法直接獲取模型部署權(quán)限,金山云作為中轉(zhuǎn)方對(duì)接原廠商,憑借海量客戶資源爭(zhēng)取更優(yōu)合作價(jià)格,為此專門設(shè)立采購(gòu)團(tuán)隊(duì)與模型廠商洽談?wù)劭郏瑫r(shí)組建技術(shù)團(tuán)隊(duì)保障開源模型的快速上線,實(shí)現(xiàn)“模型發(fā)布次日即可在平臺(tái)提供服務(wù)”的響應(yīng)速度。
從技術(shù)架構(gòu)來看,所有API服務(wù)提供商均需覆蓋資源層、平臺(tái)組件等核心模塊,而行業(yè)競(jìng)爭(zhēng)的關(guān)鍵在于兩點(diǎn):一是性價(jià)比,滿足用戶對(duì)低成本使用AI服務(wù)的需求;二是性能穩(wěn)定性,通過KB/PB分離、TPP并行等優(yōu)化算法,提升推理速度與服務(wù)可靠性,這也是金山云API服務(wù)的核心競(jìng)爭(zhēng)力,更是普惠算力的重要落地方式。
實(shí)際應(yīng)用中,AI API服務(wù)的用戶群體廣泛,有同事在出差途中與陌生人交流后,對(duì)方當(dāng)場(chǎng)注冊(cè)金山云賬號(hào)并啟用API服務(wù)。目前我們已積累了各類行業(yè)用戶,其中包括國(guó)內(nèi)多家知名大型模型廠商(作為中立云廠商,我們?yōu)槠涮峁┒嘣?wù)支持)。
值得一提的是,代碼生成是當(dāng)前熱門賽道,金山云也針對(duì)性開發(fā)了內(nèi)部研發(fā)工具。公司內(nèi)部對(duì)該工具的使用極為重視,管理層已調(diào)研所有程序員的使用頻率,以此推動(dòng)內(nèi)部AI工具的深度應(yīng)用。
結(jié)合網(wǎng)上的“AIGC適用度四象限圖”,不同場(chǎng)景的AI應(yīng)用適配性存在差異:右上角“想象力優(yōu)先”象限的應(yīng)用最為廣泛;右下角代碼生成等賽道已有實(shí)際落地案例;左上角容錯(cuò)率低的場(chǎng)景目前應(yīng)用較少;左下角最嚴(yán)謹(jǐn)?shù)念I(lǐng)域則有部分企業(yè)主攻。而金山云的核心目標(biāo),正是為各領(lǐng)域用戶提供“助飛想象”的AI引擎。
![]()
最后,金山云為用戶提供完整的技術(shù)支持體系。最底層是基礎(chǔ)設(shè)施層,提供高性能算力集群。在此基礎(chǔ)上是AI平臺(tái)層,用戶可通過金山云調(diào)用各種市場(chǎng)常用模型。
目前我們的平臺(tái)支持近30種不同模型,包括Kimi、Deepseek等熱門模型,甚至一些海外模型。通過一站式訪問渠道,用戶能專注于業(yè)務(wù)創(chuàng)新。
總之,金山云始終致力于從技術(shù)底座層面幫助用戶實(shí)現(xiàn)想象力,推動(dòng)AI技術(shù)在各行各業(yè)的落地應(yīng)用。
更多干貨分享敬請(qǐng)注我們的公眾號(hào)與視頻號(hào)~超多精彩對(duì)話內(nèi)容等待您的解鎖!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.