今天上午,“全球大模型第一股”智譜在港交所主板掛牌上市,發(fā)行價(jià)為每股 116.20 港元(現(xiàn)匯率約合 104.5 元人民幣),開盤報(bào) 120 港元 / 股,市值突破 528 億港元。
據(jù)“晚點(diǎn)LatePost”獲取的清華大學(xué)計(jì)算機(jī)系教授、智譜創(chuàng)立發(fā)起人兼首席科學(xué)家唐杰內(nèi)部信,智譜很快將推出新一代模型 GLM-5。
唐杰在信中提到,今天是“智譜生命中激動(dòng)人心的一天”。智譜 2025 年如期完成了年初定下的戰(zhàn)略,即 4 月發(fā)一個(gè)“穩(wěn)住陣腳”的模型、年中發(fā)一個(gè)“上牌桌”的模型(成為 one of the best)、年底發(fā)一個(gè) Top 1 的模型。
內(nèi)部信還介紹了智譜今年將聚焦的三個(gè)技術(shù)方向:全新的模型架構(gòu)設(shè)計(jì),更通用的 RL(強(qiáng)化學(xué)習(xí))范式以及對(duì)模型持續(xù)學(xué)習(xí)與自主進(jìn)化的探索,這三個(gè)方向均圍繞基礎(chǔ)模型能力提升展開。
唐杰透露,智譜內(nèi)部設(shè)立了一個(gè)全新部門 X-Lab,將致力于用開放的方式把更多年輕人聚集起來做前沿性探索,包括全新的模型架構(gòu)、新的認(rèn)知范式、還將孵化新項(xiàng)目,不局限于軟件或是硬件。
“同時(shí),我們也會(huì)擴(kuò)大對(duì)外投資,不僅僅是戰(zhàn)略聯(lián)合已有的被投企業(yè),也要開辟新的版圖,讓整個(gè)行業(yè)貫通起來,讓整個(gè)生態(tài)一起繁榮。在 X-Lab,每個(gè)人的使命就是做完全顛覆式的創(chuàng)新,最終回歸到 AGI 的主線。”
以下是唐杰內(nèi)部信全文:
用“咖啡”的精神做 AGI
在香港科技大學(xué)做短期訪問時(shí),和楊強(qiáng)教授在實(shí)驗(yàn)室一樓的咖啡廳偶然碰到。我說這幾天咖啡喝的太多,感覺有點(diǎn)上癮,需要戒一戒了。
楊老師說:“為什么要戒呢?上癮也不一定是壞事呀,如果我們做研究能像喝咖啡一樣上癮,又何愁研究做不好呢?”。
是啊,“上癮”便是人生的精彩所在,無論是研究,還是其它事,只要專注、努力,就一定能做好。
“讓機(jī)器像人一樣思考”是智譜自始至終的愿景和理想,也是智譜人持之以恒奮斗的唯一目標(biāo)。
2018年底,在人腦認(rèn)知的雙系統(tǒng)理論的啟發(fā)下,我們?cè)O(shè)計(jì)了一個(gè)擁有快思考+慢思考的機(jī)器“認(rèn)知”系統(tǒng)。2019年我們正式成立智譜,開始嘗試探索AGI,實(shí)現(xiàn)“讓機(jī)器像人一樣思考”的宏偉愿景。
這里的最大挑戰(zhàn)可能是直到今天也沒有人包括我們自己能夠給出一個(gè)準(zhǔn)確的AGI定義以及如何實(shí)現(xiàn)AGI的技術(shù)路徑,也許這正是探索AGI的魅力所在。
我們處在歷史上一個(gè)從未有過的非凡時(shí)刻,一個(gè)技術(shù)再一次顛覆式地改變世界的時(shí)刻。大模型不僅是通用人工智能的關(guān)鍵底座,更有望成為驅(qū)動(dòng)生產(chǎn)力變革的核心引擎。
回顧一路走來的歷程,我們能走到今天的一個(gè)重要原因是,我們始終堅(jiān)持做讓用戶真正用得上的AI技術(shù)。只有真正有人用的理論、技術(shù)或產(chǎn)品才能最終成為AGI之路上的重要成就。當(dāng)然,不是所有的創(chuàng)新都能成功,我們也有很多有風(fēng)險(xiǎn)的項(xiàng)目都以敗告終,但這也往往教會(huì)了我們從失敗中汲取力量,這讓智譜變得更強(qiáng)大,對(duì)AGI的理解也更深刻。
更重要的是,這讓我們注重實(shí)用的同時(shí),不再只盯著短期收益:幫助用戶、幫助國家、幫助全球科技進(jìn)步成為智譜的長期目標(biāo)。
2020年,我們推出了自己的大模型算法架構(gòu)GLM,并開始嘗試訓(xùn)練100億參數(shù)的基座模型,模型很成功,得到包括美團(tuán)在內(nèi)的很多企業(yè)試用,這是一個(gè)很大膽的嘗試,因?yàn)楫?dāng)年還是BERT模型橫行的小模型時(shí)代。但當(dāng)時(shí)的成功距離我們夢(mèng)想中的AGI還遙不可及。部分原因是模型的知識(shí)量還不夠大,而另一部分原因則是模型還不會(huì)像人一樣推理思考。
2021到2022年,大模型發(fā)展并不順利,大多數(shù)人并不接受“讓機(jī)器像人一樣思考”這種類似登月一樣的瘋狂計(jì)劃,也不認(rèn)為這可能是個(gè)非常大的技術(shù)變革機(jī)會(huì),或者害怕失敗。我們還是決定賭一把,用更多數(shù)據(jù)訓(xùn)練一個(gè)1300億參數(shù)的大模型。
這個(gè)決策很難,因?yàn)檫€不能影響公司總體發(fā)展節(jié)奏。為此我們成立了兩個(gè)專門的小型創(chuàng)新團(tuán)隊(duì),一個(gè)負(fù)責(zé)模型訓(xùn)練,這就是后來公司的GLM三劍客;另一個(gè)則獨(dú)立負(fù)責(zé)MaaS平臺(tái)建設(shè),當(dāng)時(shí)這兩個(gè)小團(tuán)隊(duì)可能互相都不知道對(duì)方的存在。
2022年中,GLM-130B訓(xùn)出來了,其中很多精細(xì)的設(shè)計(jì)引起了全球關(guān)注;同時(shí)MaaS平臺(tái)上線,也就是現(xiàn)在的bigmodel.cn,有了第一批真正的API用戶。隨后,我們正式在公司成立了AI院,專注下一代大模型研發(fā);成立MaaS平臺(tái)部,負(fù)責(zé)對(duì)外提供大模型API服務(wù)。有時(shí)候,我們需要找到有足夠大膽夢(mèng)想的人(甚至專門投入更多精力去找這樣的人),一個(gè)大膽宏偉的目標(biāo)也許決定了一半的成功。
2023年,我和國內(nèi)一個(gè)頂尖的創(chuàng)業(yè)前輩(其實(shí)他比我小不少)聊AI可能對(duì)未來的改變,我們一致認(rèn)為AI會(huì)顛覆搜索、顛覆瀏覽器,會(huì)給每個(gè)人帶來一個(gè)全新的AI助手;甚至有了這個(gè)AI助手后,我們也不再需要應(yīng)用商店,反之我們可能需要為AI打造一個(gè)“API商店”,可能這個(gè)API商店的底層邏輯就是顛覆現(xiàn)有的操作系統(tǒng);隨后,也許更重大的顛覆是計(jì)算機(jī)本身,因?yàn)閷脮r(shí)我們可能不是需要一個(gè)給人用的計(jì)算機(jī)了,而是適合AI的計(jì)算機(jī)。
這個(gè)變革發(fā)生的意義將是無窮的,因?yàn)樗鼘氐字厮苡?jì)算機(jī)底層邏輯,挑戰(zhàn)計(jì)算機(jī)界用了80年的奠基石——馮諾伊曼體系。聊到這里的時(shí)候,我們不約而同覺得我們對(duì)AI的投入還太少了,還不夠All-in。
現(xiàn)實(shí)也是殘酷的,All-in不僅需要堅(jiān)定的信念,也需要極其強(qiáng)大的資金、團(tuán)隊(duì)支持,更需要精準(zhǔn)的預(yù)判。2023到2024年是全球大模型的爆發(fā)年,大廠紛紛“All-in”大模型,國內(nèi)也掀起創(chuàng)業(yè)高潮,百模大戰(zhàn)、各種AI助手層出不窮。
我們那時(shí)候可能也有失誤,有技術(shù)的也有商業(yè)的。現(xiàn)在復(fù)盤,可能原因是我們自己在追逐AGI的路上有迷失的時(shí)候,會(huì)被眼前的短期收益、短期熱鬧所迷惑。AGI是個(gè)技術(shù)變革,技術(shù)是平權(quán)的,是公開透明的,是要讓所有人都能用的上并從中獲益。
隨后DeepSeek的出現(xiàn)警醒了我們,文鋒2023年創(chuàng)業(yè)的時(shí)候和我聊過,當(dāng)時(shí)我并沒有意識(shí)到他對(duì)AGI如此執(zhí)著,感謝他帶給我很多不一樣的思考。選擇對(duì)AGI技術(shù)的執(zhí)著追求,不斷探索AGI的上界,同時(shí)精準(zhǔn)的未來預(yù)判成為下一步智譜需要不斷改進(jìn)和升華的地方。這兩年讓我們經(jīng)歷很多,更重要的是“強(qiáng)化學(xué)習(xí)”了我們對(duì)AGI、對(duì)公司治理和商業(yè)競(jìng)爭的認(rèn)知。
過去一年,我們其實(shí)做了一次比較系統(tǒng)的"強(qiáng)化"。我們喊出了“定力”與“成就”的口號(hào),要求大家保持定力,不驕不躁,不妄自菲薄,成就智譜每個(gè)人手上的事,成就自己。
年初的時(shí)候,一切都那么難,模型效果達(dá)不到預(yù)期,全國上下價(jià)格戰(zhàn),殺出重圍需要找到一個(gè)精準(zhǔn)的突破口。
我們堅(jiān)守了陣地,終于找到Coding作為突破口。
如果說4月份GLM-4.1的發(fā)布像是象征性的試探,那7月底的GLM-4.5的發(fā)布幾乎更是一場(chǎng)決戰(zhàn),所有技術(shù)、平臺(tái)、業(yè)務(wù)團(tuán)隊(duì)捏一把汗,日日夜夜加班,我們終于迎來一場(chǎng)久逢的勝利,接著GLM-4.6和GLM-4.7讓我們模型能力方面和那些國際頂尖模型并駕齊驅(qū)。
我們的GLM-4.7 在包括AA、競(jìng)技場(chǎng)等多項(xiàng)評(píng)測(cè)中獲得開源模型、國產(chǎn)模型的SOTA,來自用戶側(cè)的模型Coding和Agent真實(shí)體感也非常好,全球184個(gè)國家的15萬開發(fā)者朋友使用GLM Coding Plan,GLM-4.7發(fā)布后MaaS平臺(tái)ARR年化收入超過5億(其中海外收入超過2億),從2000萬到5億(25倍)僅用了10個(gè)月。
總體來說,在模型側(cè)我們?nèi)缙谕瓿闪四瓿醵ㄏ碌?月發(fā)一個(gè)“穩(wěn)住陣腳”的模型、年中發(fā)一個(gè)“上牌桌”的模型(即成為 one of the best)、年底發(fā)一個(gè)Top 1的模型的整體戰(zhàn)略。這為我們后續(xù)繼續(xù)沖刺AGI技術(shù)高地打下重要根基。
我們的「主權(quán)AI」也迎來全新進(jìn)展:馬來西亞國家級(jí)MaaS平臺(tái)基于Z.ai開源模型構(gòu)建,GLM成為馬來的國民級(jí)模型。主權(quán)AI出海是我參加了總書記座談會(huì)后被總書記的“中國AI要走出國門”感召,但說實(shí)話我也不知道應(yīng)該怎么做,我們的國際團(tuán)隊(duì)敢拼敢打敢成事,完成中國大模型出海從無到有的一個(gè)里程碑。業(yè)務(wù)方面,我們敢于競(jìng)爭,再次完成了年度超一倍的營收增長目標(biāo)。
在種種困難和機(jī)遇并存的情況下,今天,我們以一種幾乎不可能的姿勢(shì)成為了全球大模型第一股,這表明了市場(chǎng)對(duì)我們技術(shù)與商業(yè)價(jià)值的認(rèn)可。“Make impossible possible”—— 還記得我們?cè)?jīng)說過的嗎?
這一年來,蛻變最大的可能是不是智譜,而是一群一線的年輕人,他們把很多看起來不可能的事,真的做成了。
2026年,公司的目標(biāo)是成為國際領(lǐng)跑的大模型企業(yè)。過去一年大家討論大模型,很多在聊應(yīng)用、聊生態(tài)。
真正決定下一階段格局的,還是更底層的兩件事——模型架構(gòu)與學(xué)習(xí)范式。同時(shí),應(yīng)用側(cè)可能會(huì)出現(xiàn)一個(gè)清晰的方向:AI替代不同工種/任務(wù)的爆發(fā)年。
基于這一判斷,我們?cè)?2026 年將聚焦于:
GLM-5。很快GLM-5將跟大家見面,通過進(jìn)一步的Scaling和很多全新技術(shù)改進(jìn),相信GLM-5會(huì)帶給大家很多新奇體驗(yàn),讓AI幫大家完成更多真實(shí)任務(wù)。全新的模型架構(gòu)設(shè)計(jì)。已經(jīng)廣泛使用近10年的Transformer架構(gòu)已經(jīng)顯露出一些不足,包括超長上下文的計(jì)算開銷、記憶機(jī)制、更新機(jī)制等。
這些都需要探索全新的模型架構(gòu),發(fā)現(xiàn)新的Scaling范式,通過芯片-算法協(xié)同設(shè)計(jì)等技術(shù)提高計(jì)算效率。具有更強(qiáng)泛化能力的RL。當(dāng)前主流的RLVR范式雖然在數(shù)學(xué)和代碼領(lǐng)域取得了成功,但其依賴人工構(gòu)造可驗(yàn)證環(huán)境的局限性也日益凸顯。
今年需要探索更通用的RL范式,支持AI不僅能在人類指令下完成特定任務(wù),更要能理解并執(zhí)行跨越數(shù)小時(shí)甚至數(shù)天的長時(shí)程任務(wù)。最具挑戰(zhàn)性的探索,是開啟通往持續(xù)學(xué)習(xí)與自主進(jìn)化的道路。當(dāng)前所有主流的AI模型,其智能在部署后基本上是靜態(tài)的。
它們通過一次性的、耗資巨大的訓(xùn)練過程獲得知識(shí),然后在應(yīng)用中逐漸過時(shí)。這與人腦能夠從與世界的持續(xù)交互中不斷學(xué)習(xí)、進(jìn)化的方式截然不同。我們需要對(duì)下一代學(xué)習(xí)范式——在線學(xué)習(xí)(Online Learning)或持續(xù)學(xué)習(xí)(Continual Learning)進(jìn)行前瞻性布局。
我們不是一家傳統(tǒng)公司,我們也不打算成為其中之一。我們希望成為一家一切皆有可能發(fā)生的AI原生公司:打造不斷提升智能上界的下一代模型,研發(fā)AI為核心的產(chǎn)品服務(wù)用戶。我們要讓AI成為每個(gè)人最得力的助手,幫助我們完成任務(wù)。我們認(rèn)為還需要利用AI參與治理公司降本增效、做到更公平。
隨著時(shí)間的推移,一個(gè)公司往往會(huì)習(xí)慣于做同樣的事情,做漸進(jìn)式的改進(jìn),這會(huì)限制我們的創(chuàng)新力。但在AI時(shí)代,一切都是變革式的,我們需要有點(diǎn)“不舒服”才能保持創(chuàng)新力,才能提出革命性的想法推動(dòng)下一個(gè)大的增長領(lǐng)域。
因此,我們?cè)谥亲V內(nèi)部設(shè)立了一個(gè)全新部門X-Lab,這個(gè)部門將致力于用開放的方式把更多年輕人聚集,做前沿性探索,包括全新的模型架構(gòu)、新的認(rèn)知范式、還將孵化新項(xiàng)目,不局限于軟件或是硬件。
同時(shí),我們也會(huì)擴(kuò)大對(duì)外投資,不僅僅是戰(zhàn)略聯(lián)合已有的被投企業(yè),也要開辟新的版圖,讓整個(gè)行業(yè)貫通起來,讓整個(gè)生態(tài)一起繁榮。在X-Lab,每個(gè)人的使命就是做完全顛覆式的創(chuàng)新,最終回歸到AGI的主線。
今天是智譜生命中激動(dòng)人心的一天,是智譜歷史上一個(gè)重要的里程碑,更是智譜一個(gè)全新時(shí)代的開啟。我很喜歡Z.ai這個(gè)品牌,Z是字母表中的最后一個(gè),代表終極境地,我們希望在AGI的探索歷程上能走到智能的終極境地,這是我們努力的目標(biāo)。我們非常興奮:
- 有一個(gè)雄心勃勃、改變世界的事業(yè)
- 著眼長遠(yuǎn)利益、放眼未來
- 更加專注,探索 AGI 的本質(zhì)
- 用 AI 賦能偉大的企業(yè)家和公司的蓬勃發(fā)展
- 用更精準(zhǔn)的預(yù)判抓住企業(yè)發(fā)展機(jī)遇
- 最終,希望我們能夠?yàn)槿祟惿鐣?huì)帶來不一樣的 AI,切實(shí)推動(dòng)人類福祉的進(jìn)步。
這是一個(gè)無與倫比的開心時(shí)刻,這種開心不是一時(shí)的多巴胺,而是探索 AGI 之路上積累起來的內(nèi)啡肽,讓我們更加專注,腳踏實(shí)地,持續(xù)前行!
唐杰
2026.1.8
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.