編輯部 整理自 MEET2026量子位 | 公眾號(hào) QbitAI
對(duì)企業(yè)來(lái)說(shuō),如何判斷大模型究竟是真的有用,還是只是噱頭?
對(duì)此,潞晨科技創(chuàng)始人兼董事長(zhǎng),新加坡國(guó)立大學(xué)校長(zhǎng)青年教授尤洋給出了他的判斷框架:
- 有三類企業(yè)需要行業(yè)模型或者私有模型:傳統(tǒng)大型企業(yè)、有海量數(shù)據(jù)的中小型企業(yè),以及顛覆行業(yè)的新興公司。
![]()
具體落地方面,尤洋給出的判斷標(biāo)準(zhǔn)也很明確。
首先,如果只是業(yè)務(wù)只涉及日常辦公,或主要處理文本數(shù)據(jù),沒(méi)必要上私有模型
直接調(diào)用現(xiàn)成的大模型API,或RAG+API,足以覆蓋大多數(shù)需求。
如果企業(yè)本身?yè)碛泻A慷嗄B(tài)數(shù)據(jù),或?qū)?shù)據(jù)隱私有要求,構(gòu)建私有模型是比較好的選擇
為了完整呈現(xiàn)尤洋的思考,在不改變?cè)獾幕A(chǔ)上,量子位對(duì)演講內(nèi)容進(jìn)行了整理編輯,希望能提供新的視角與洞察。
MEET2026智能未來(lái)大會(huì)是由量子位主辦的行業(yè)峰會(huì),近30位產(chǎn)業(yè)代表與會(huì)討論。線下參會(huì)觀眾近1500人,線上直播觀眾350萬(wàn)+,獲得了主流媒體的廣泛關(guān)注與報(bào)道。
核心觀點(diǎn)梳理
- 大模型的應(yīng)用肯定不僅限于聊天機(jī)器人或者編程助手,未來(lái)大模型在千行百業(yè)里邊落地,才能產(chǎn)生它最大的價(jià)值。大模型的價(jià)值在很多場(chǎng)景還沒(méi)有真正發(fā)揮出來(lái)。
- 有三類企業(yè)需要行業(yè)模型或者私有模型,第一類是傳統(tǒng)大型企業(yè),第二類是有海量數(shù)據(jù)的中小型企業(yè),第三類是顛覆行業(yè)的新興公司。
- 用大模型做To B,最關(guān)鍵的是后訓(xùn)練或Agent化,如果只是調(diào)大模型API,大家用的模型都一樣,顯然沒(méi)有任何差異性。開(kāi)源模型只有在被“專業(yè)訓(xùn)練”后才能戰(zhàn)勝閉源模型。
- 企業(yè)部署大模型成功的關(guān)鍵,一是要最大化算力效率,另外還要有微調(diào)SDK和低代碼模板。
- 潞晨云最新上線微調(diào)SDK,開(kāi)發(fā)者僅需專注模型與算法創(chuàng)新,訓(xùn)練調(diào)度、分布式框架適配、底層云基礎(chǔ)設(shè)施及運(yùn)維由平臺(tái)完成。
以下是尤洋的演講全文:
四年收獲八個(gè)世界五百?gòu)?qiáng),十個(gè)世界兩千強(qiáng)
今天很開(kāi)心在量子位大會(huì)跟大家交流,潞晨堅(jiān)信未來(lái)AI大模型在千行百業(yè)里面落地,才能產(chǎn)生它最大的價(jià)值,而不僅僅限于聊天機(jī)器人或者編程助手。
我是新加坡國(guó)立大學(xué)的教授,很榮幸在2021年ChatGPT為代表的大模型浪潮前,就創(chuàng)立了潞晨科技這家公司,專注于該領(lǐng)域。
首先介紹一下潞晨在過(guò)去幾年的一些實(shí)踐,取得的一些成績(jī)。
![]()
技術(shù)方面,2018年開(kāi)始,潞晨開(kāi)始著手做一些大模型的基礎(chǔ)設(shè)施相關(guān)的軟件,最下層的不管從編譯器還是CUDA包括優(yōu)化器,都是訓(xùn)練部署大模型比較需要的。
比如2018年打造的LAMB優(yōu)化器,在Google的千卡集群TPU Pod上將大模型訓(xùn)練時(shí)間從三天縮減到76分鐘
今天,LAMB優(yōu)化器和方法還在被微軟的DeepSpeed、字節(jié)的Megascale,以及英偉達(dá)的Megatron-LM等萬(wàn)卡集群系統(tǒng)所使用。
基于LAMB,潞晨做了一些后續(xù)工作,成功應(yīng)用在華為的盤(pán)古大模型以及字節(jié)的推薦模型里,并獲得了ACL杰出論文。
世界上最頂尖的專家之一,Benjamin Mann(Anthropic的聯(lián)合創(chuàng)始人,GPT-3的共同第一作者),他在2019年使用LAMB,首次把Transformer訓(xùn)練擴(kuò)展到128個(gè)GPU。
![]()
這從英偉達(dá)官方GitHub上可以查到,英偉達(dá)專家曾經(jīng)使用過(guò)LAMB取得17倍的加速
![]()
之后,潞晨把這些針對(duì)大模型訓(xùn)推性能的系統(tǒng)優(yōu)化技術(shù),打造成了一個(gè)軟件系統(tǒng)Colossal-AI,并對(duì)基礎(chǔ)版本進(jìn)行了開(kāi)源。
潞晨希望通過(guò)更好用、速度更快、性價(jià)比更高的系統(tǒng)或者軟件,幫助用戶降本增效的做出所需要的私有模型。
經(jīng)過(guò)幾年發(fā)展,Colossal-AI在GitHub上這個(gè)細(xì)分賽道里面指標(biāo)是最高的,大家可以嘗試一下開(kāi)源版本,潞晨也提供相應(yīng)的進(jìn)階商業(yè)支持。
![]()
目前,潞晨收獲了八個(gè)世界五百?gòu)?qiáng),十個(gè)世界兩千強(qiáng),六十個(gè)一流大學(xué)和三千家企業(yè)在內(nèi)來(lái)自全球的付費(fèi)客戶,涵蓋了汽車、互聯(lián)網(wǎng)、手機(jī)、制藥、制造業(yè)等等。
這個(gè)過(guò)程之中,大家對(duì)大模型的認(rèn)可程度是逐漸變高的。
對(duì)標(biāo)Thinking Machines Lab,挖掘AI落地千行百業(yè)的價(jià)值
OpenAI前CTO也做了一個(gè)創(chuàng)業(yè)公司叫Thinking Machines Lab,雖然沒(méi)有任何收入但是估值已經(jīng)120億美金了。
它跟潞晨做的事情也比較類似,打造了Tinker模型微調(diào)開(kāi)發(fā)平臺(tái),幫助企業(yè)和研發(fā)人員做出自己的私有模型或者AI Agent。
還有Together AI,通過(guò)優(yōu)化技術(shù)提升GPU的價(jià)值。
任何企業(yè)做大模型,大多數(shù)決策者首先要問(wèn)的第一個(gè)問(wèn)題就是:我的企業(yè)是否真的需要大模型,大模型是不是真的有效,還是只是一個(gè)噱頭?
先展示一些互聯(lián)網(wǎng)上可以查到的案例:中石油的三千億參數(shù)的昆侖大模型,Bloomberg的金融大模型,華為云發(fā)布的盤(pán)古氣象大模型,寶馬的優(yōu)化汽車制造流程的大模型以及李維斯、航空航天、動(dòng)畫(huà)、西門(mén)子,還有制藥行業(yè)。
![]()
從這大概可以看出這些行業(yè)的數(shù)據(jù)特點(diǎn),不僅僅是DeepSeek或者ChatGPT這樣的通用文本或者編程模型能解決的,更重要的是大模型在千行百業(yè)落地價(jià)值,很多場(chǎng)景還沒(méi)有真正發(fā)揮出來(lái)
比如說(shuō)未來(lái)的石油勘探,讓大模型判斷地下的地質(zhì)結(jié)構(gòu),研究地球的數(shù)據(jù)。比如打一口井成本是1000萬(wàn)美金,打十次才有一口比較好的油井,通過(guò)大模型優(yōu)化即使只提升10%,在這個(gè)行業(yè)的收益前景也非常可觀。
之前大家用一些正演反演算法判斷地下的斷層、地下復(fù)雜的結(jié)構(gòu)數(shù)據(jù)量非常大,PB級(jí)別的,傳統(tǒng)的算法穩(wěn)定性不好,速度也比較慢無(wú)法擴(kuò)展。
大模型可以用更好的方式,核心都是在解方程組,可以給出一個(gè)很好的近似解。因此,大模型在千行百業(yè)的價(jià)值還沒(méi)有完全發(fā)揮出來(lái)。
下一個(gè)問(wèn)題是:到底什么樣的企業(yè)或者什么樣的業(yè)務(wù)需要自己做一個(gè)私有大模型,不僅僅調(diào)用一下標(biāo)準(zhǔn)模型的API就夠了?
至少有三類:
第一類,傳統(tǒng)的大型企業(yè),包括世界五百?gòu)?qiáng)全球兩千強(qiáng),這些企業(yè)或多或少都有自己行業(yè)比較珍貴的大量信息或者數(shù)據(jù)。
第二類,有海量數(shù)據(jù)的中小型企業(yè),可能專精于某個(gè)細(xì)分領(lǐng)域,數(shù)據(jù)就是大模型的源泉。
第三類,顛覆行業(yè)的新型公司用AI技術(shù)找到新的思路,不管金融、制藥、社交、游戲、電商等等都可以。這些企業(yè)是最需要自己造一個(gè)私有大模型或者行業(yè)大模型的企業(yè)。
具體落地方式有三種。
第一,假如說(shuō)沒(méi)有行業(yè)數(shù)據(jù),只是處理一些日常辦公或者處理文本類的東西,企業(yè)直接調(diào)用ChatGPT或者通義千問(wèn)API一般就能滿足需求。
第二,假如說(shuō)有足量的文本數(shù)據(jù),這個(gè)階段很多時(shí)候不用構(gòu)建自己的大模型,構(gòu)建RAG/Agent加上大模型API也能滿足。
第三,如果一個(gè)企業(yè)有海量多模態(tài)數(shù)據(jù)或者強(qiáng)隱私要求,不管是石油勘探或者高鐵、汽車、制藥、金融等,往往有很多多模態(tài)數(shù)據(jù),這時(shí)候構(gòu)建一個(gè)私有模型是比較好的選擇來(lái)滿足需求
這張圖來(lái)自于一個(gè)Grand View Research,它對(duì)大語(yǔ)言模型市場(chǎng)的預(yù)測(cè),大概分為三個(gè)部分。
![]()
第一,Domain-Specific LLMs,就是領(lǐng)域大模型,做法律GPT、醫(yī)療GPT、教育GPT、或者說(shuō)石油化工GPT這種都是領(lǐng)域大模型。
第二,通用大模型
第三,私有大模型,這個(gè)大模型只能放在公司內(nèi)部用,與外部隔離。
當(dāng)然這個(gè)預(yù)測(cè)不一定準(zhǔn)確,但潞晨可以觀察一下它預(yù)測(cè)的未來(lái)趨勢(shì):
- 領(lǐng)域大模型未來(lái)到2033年的時(shí)候是最大的,大概占40%的市場(chǎng)份額;
- 通用大模型ChatGPT或者豆包或者Gemini占30%;
- 私有大模型也能占到30%。
Training As A Service
下一個(gè)問(wèn)題,如果決定打造自己的私有大模型或者行業(yè)大模型,如何用好大模型?
在大模型ToB賽道,首先先不用考慮去做通用的ChatGPT或DeepSeek,因?yàn)椴辉谕粋€(gè)賽道。
如果用大模型做ToB的話,最關(guān)鍵的就是后訓(xùn)練或者Agent化。如果只是調(diào)通用大模型API的話,大家用的大模型都一模一樣,顯然沒(méi)有任何差異性和競(jìng)爭(zhēng)壁壘
開(kāi)源基模或者標(biāo)準(zhǔn)API,經(jīng)過(guò)專業(yè)的后處理,才能戰(zhàn)勝閉源模型。即給它足量的行業(yè)數(shù)據(jù),最好是多模態(tài)數(shù)據(jù),在高效優(yōu)化情況下把大模型優(yōu)化成行業(yè)專才。
這要求企業(yè)把兩方面事情做好:
第一,最大化算力的效率,只要我在造私有大模型,肯定算力一個(gè)很大的賬單。
第二,做出很好的微調(diào)模板,讓用戶快速做出自己行業(yè)模型、私有模型。
剛才提到目前業(yè)界龍頭是Thinking Machines Lab的Tinker,潞晨打造了一個(gè)類似的產(chǎn)品,潞晨云的微調(diào)SDK
潞晨希望打造成標(biāo)準(zhǔn)化模板式的服務(wù),讓用戶只需用微調(diào)SDK就可以達(dá)到Training As A Service的效果。
不管是強(qiáng)化學(xué)習(xí)還是微調(diào)本質(zhì)上都是Training,都是在算梯度,算出更好的梯度,梯度不斷的更新參數(shù)。
開(kāi)發(fā)人員、研究人員不管是石油公司的大模型開(kāi)發(fā)人員還是金融公司、制藥公司的,他們應(yīng)該專注于自己的數(shù)據(jù)和業(yè)務(wù),而不應(yīng)該花太多時(shí)間構(gòu)建自己的GPU集群、分布式計(jì)算、優(yōu)化器等大模型基礎(chǔ)設(shè)施的東西。
目前這類產(chǎn)品有兩個(gè)極端:
第一,極端強(qiáng)調(diào)零代碼微調(diào),壞處用戶對(duì)模型的控制力度大幅度下降,只能搭建demo級(jí)別的玩具,很難在真實(shí)業(yè)務(wù)落地。
第二,極端全手寫(xiě)裸機(jī)開(kāi)發(fā),全棧工程師自己搞定操作系統(tǒng)、分布式計(jì)算、優(yōu)化器、張量并行、數(shù)據(jù)并行、集群運(yùn)維等,顯然浪費(fèi)太多精力。
潞晨希望把復(fù)雜的流程變成函數(shù)級(jí)的管理。用戶的目的本質(zhì)上就是算梯度,由這幾個(gè)函數(shù)負(fù)責(zé)把后臺(tái)這些東西管理好,這樣用戶只需要調(diào)用這幾個(gè)函數(shù)級(jí)的指令就可以快速的造出自己的行業(yè)模型、私有模型。
![]()
想讓用戶快速、簡(jiǎn)便、低成本地造出自己的行業(yè)模型、私有模型,關(guān)鍵在于實(shí)現(xiàn)工程與靈活度的最優(yōu)平衡,既不是零代碼的微調(diào)也不是全手寫(xiě)的裸機(jī)。
這是整個(gè)流程,通過(guò)這種方式按照SDK定義一下模型和數(shù)據(jù)一鍵式在云上訓(xùn)練部署,這樣也能兼容Tinker的各種開(kāi)源的SDK,實(shí)現(xiàn)監(jiān)督微調(diào)、強(qiáng)化學(xué)習(xí)等。背后也集成了潞晨對(duì)算力性能優(yōu)化的工具Colossal-AI來(lái)幫助用戶降低成本。
![]()
當(dāng)然,用戶也可以選擇自己的框架、編程工具、任務(wù)調(diào)度方式等。
最后是一些真實(shí)案例:
- 某個(gè)世界五百?gòu)?qiáng)車企通過(guò)這套技術(shù)打造出多模態(tài)自動(dòng)化的決策支持系統(tǒng);
- 世界五百?gòu)?qiáng)電商的自動(dòng)駕駛業(yè)務(wù),在3D點(diǎn)云技術(shù)也在潞晨的幫助下得到很大的提升;
- 潞晨也助力另一家世界五百?gòu)?qiáng)車企打造智能座艙模型;
- 潞晨還幫助一家制造業(yè)世界500強(qiáng)企業(yè)打造了基于AI Agent及具身智能的供應(yīng)鏈系統(tǒng)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.