![]()
來源 | 伯虎財經(bohuFN)
作者 |All too well
今年2月,當恒生科技指數還處在一路向南的慘淡當中時,有兩個“小登”走出了不一樣的行情。上市兩個月的智譜從一月底的226.4港元每股一路飆升到發稿前的628港元每股;上市不過一個半月的MiniMax從一月底的473港元每股上漲到發稿前的880港元每股。
兩家公司市值均一度跨過3000億港元關口。
3000億港元是什么概念?橫向對比一下就很直觀——當前B站總市值957.17億港元,京東市值約為3016.79億港元。也就是說,這兩家成立還尚不足十年的AI公司,市值已經悄然越過許多互聯網巨頭。
和“小登”在二級市場予取予求不同,大廠們正忙著讓更多人用上AI。
今年春節,字節、阿里和騰訊紛紛取消了春節休假,嚴陣以待,應對用重金換來的AI需求。在各家的戰報里,僅除夕當天,豆包AI互動總次數達到19億次;阿里花費30億元,讓近2億用戶使用千問下單消費;騰訊用10億紅包,換來了1.14億的月活新高。
這是大廠們2026年的第一波交鋒。如何撬動和發現更多的需求?如何先人一步的占據AI時代的入口?這是大廠們關心的問題。
無論是大廠們的撒幣買用戶,還是二級市場上的AI“小登”當道,都是AI時代里的不同切口。毫無疑問的是,AI應用已經開始深入融合我們的生活,它既站在港股AI“小登”的升浪中,也藏身在大廠的FOMO情緒里,催促后者把它推向每一個人。
01 2026,AI商業化元年?
MiniMax和智譜的狂飆之所以讓不少人擔憂,很大程度上是因為他們的市值無法適用于傳統的估值模型。
即便是把它們放到AI企業的籃子里,也屬于是被嚴重高估的。美國同行Anthropic最新估值約3800億美元,年化收入已經超過20億美元,市銷率大約190倍。而如果以MiniMax前九個月5344萬美元對應的3000億港元營收來算,后者的市銷率超過700倍。
但推動MiniMax和智譜這波上漲的重要原因是,它們的新模型證明了中國AI團隊有能力用算法效率彌補硬件短板,做出讓專業用戶為之付費、好用的模型。
以智譜為例。
程序員一直是AI的重要付費群體,此前大火的vibe coding就是讓AI作為產出工具來完成寫代碼的工作。但在全球權威編程基準測試里,閉源模型的領先一直很明顯。
智譜新發布的GLM-5打破了這個慣例,從Artificial Analysis測試的結果來看,GLM-5直接躋身智能程度全球第4,編程能力全球第6,代理能力全球第3,緊追頂尖的閉源模型。而在AA-Omniscience幻覺率測試中,GLM-5把幻覺率壓縮至34%。
![]()
![]()
除了在推理、代碼和自主能力上的全面升級,GLM-5還大幅降低了運行成本。GLM-5引入的深度稀疏注意力機制讓它能夠根據內容智能篩選出最重要的詞,舉個例子,同樣是12.8萬個詞的長文本,GLM-5的計算量直接砍掉了一半到三分之二。因此,GLM-5的參數總量擴展到了7440億,但每次實際激活運算的參數只有400億。
新模型發布后,由于用戶規模與調用量快速提升,智譜還官宣GLM Coding Plan價格上調30%以上。主打輕量化和效率的MiniMax M2.5在被以OpenClaw為代表的Agent需求推動下,只用了一個星期的時間,就成了OpenRouter上Tokens調用量的榜一。
不再追求模型參數,而是讓用戶真正用起來,這和過去我們熟悉的AI廠商開打價格戰的競爭態勢是截然不同的。
即便是仍然花大價錢買用戶的大廠們,實際上競爭的也是好用。
晚點LatePost報道,2025年初,字節跳動CEO梁汝波曾在集團全員會上說,豆包沒顯出 “越多人用越好用” 的互聯網產品特性,他提出字節要追求智能上限。春節前,Doubao2.0升級,除夕當天,Qwen3.5上線。兩者同樣強調Agent執行能力,能辦事,真有用。視頻生成模型Seedance2.0發布后,游戲科學CEO、《黑神話:悟空》制作人馮驥更是發出了“AIGC的童年時代,結束了”的感嘆。
和小登們不同的是,這些擁有龐大生態、版圖從電商、生活服務蔓延到短視頻、游戲乃至支付巨頭們,還需要借由AI繼續鞏固自己的地位。
所以千問接入了淘寶閃購、支付寶、淘寶、飛豬、高德等阿里系應用,為了讓千問的使用體驗更好,阿里投入了大量資源,每周更新2-3次,一些需求從設計到上線僅需1-3天。
無論是智譜和MiniMax的搶跑,還是大廠的紅包大戰,其實都在面向不同的人群,努力讓AI真正被用起來。
02 繁榮背后的隱憂
OpenRouter數據顯示,今年2月第一周處理的AI tokens達到13萬億,環比1月第一周接近翻倍。這和當下行業的Agent爆發式增長有很大關系。
在海外,OpenClaw作為一款開源的個人AI助手,能夠在本地電腦或服務器上自主運行,并通過自然語言指令執行各種任務。它的爆火速度堪稱史詩級,其在發布后的短短一周內就突破10萬顆星標,成為GitHub歷史上增速最快、關注度最高的開源項目之一。
雖然當下處于墻內墻外兩開花的狀態,但AI應用還存在不少隱憂。
首先,高投入高虧損是行業常態,以智譜和MINIMAX為例。
2022—2024年、2025年上半年,智譜的營收分別為0.57億元、1.25億元、3.12億元、1.91億元,凈利潤分別為-1.43億元、-7.88億元、-29.56億元、-23.51億元,三年半虧損62.38億元。
2022—2024年、2025年前三季度,MINIMAX營收分別為0、0.03億美元、0.31億美元、0.53億美元,分別實現凈利潤-0.74億美元、-2.69億美元、-4.65億美元、-5.12億美元,三年又三個季度合計虧損13.2億美元。
虧損主要出在人力成本和算力成本。據海豚投研分析,兩個公司員工整體都沒超1000人,尤其是Minimax都不足400人;兩家公司研發人員都接近75%,單人頭月成本6.5-8.5萬元人民幣(不含期權激勵),其中Minimax研發人員單人月成本是16萬。
看著不低的人力成本,但和動不動上億美金搶人大戰的慘烈比起來,又不算離譜。真正的壓力來自算力。
從兩家公司披露的數據來看,單單模型訓練相關的算力投入,就占到了總支出的50%以上,是絕對的大頭,也是虧損的核心來源。
以2023年為例,研發一代模型的訓練成本大約在四五千萬美元之間。而當模型進入下一代,為了實現代際差異,無論是數據量、參數規模還是算力需求,往往都呈現指數級增長。模型升級一代,訓練成本提高3—5倍幾乎是常態。
也就是說,算力效率提升了,但算力總需求卻在放大。
一方面,模型規模持續膨脹,多模態能力不斷疊加;另一方面,Agent、編程助手等高頻場景開始落地,調用次數迅速上升。在這種情況下,即便單次token成本快速下行,只要總調用量和模型復雜度同步飆升,企業最終要支付的算力總賬單,反而可能越滾越大。
這也解釋了,為什么推理成本明明在下降,公司燒錢卻越來越厲害。
根據灼識咨詢數據,行業平均推理成本已從2022年底每百萬token約20美元降至2024年底不足0.1美元,未來仍可能繼續下降。單次調用確實更便宜了。
與此同時,2024年,MiniMax與推理及訓練相關的云計算成本合計約1.67億美元,占營收比例達545%。也就是說,每賺1塊錢,要付出5塊多的算力費用。智譜當年計算與算力服務費合計15.83億元,占營收506%。每進賬1塊錢,大約5塊被算力吞掉。
而且這種趨勢還愈演愈烈。智譜的算力服務費占研發開支比例,從2022年的17.3%,一路爬升到2025年上半年的71.8%;MiniMax與訓練相關的云計算開支占研發比例,也從39.4%提升至接近80%。
這就意味著,目前的情況下,模型要優秀,訓練成本就越高,收入似乎也跟不上更新迭代的速度,到底何時才會有個結果?
其次是監管和侵權風險。比如Seedance2.0不僅收到了來自版權方的律師函,還下線了爭議極大的真人素材參考能力。
浪潮之下,畢其功于一役是不切實際的想法。AI的參與者們面臨的是一場真實的商業戰爭,而剛剛過去的春節可能只不過是一道開胃前菜罷了。
參考來源:
1、至頂AI實驗室:智譜GLM-5技術曝光,代碼能力已經趕上Claude?
2、硅基星芒:智譜與Minimax交出“大招”之后,DeepSeek“平A”了一下
3、晚點AI:春節AI戰役全記錄:紅包、模型與算力
4、字母AI:跟Claude掰腕子,智譜MiniMax雙模齊發
5、海豚投研:深扒Minimax與智譜:大模型,一場算力強度與融資耐力的殘酷絕殺?
6、極客公園:為什么所有人都覺得MiniMax、智譜「太貴了」?
7、厚雪研究:中國“大模型雙雄”上市:研發支出70%-80%花在算力
文章封面首圖及配圖,版權歸版權所有人所有。若版權者認為其作品不宜供大家瀏覽或不應無償使用,請及時聯系我們,本平臺將立即更正。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.