百度的一只腳,踏進了開源這條河
百度給自己定的使命,是用科技讓復雜的事情簡單化。
Hugging Face的主頁上,百度在這句話后面又加了句:我們堅定地認為,真正的簡單源于開源。
![]()
你看,這個描述很直接,體現(xiàn)了一家技術公司,對用科技推動世界進步的責任感和美好愿望,以及堅定擁抱開源社區(qū)的理想圖景。
當然,有關Mission的這兩句話是最近幾天新加的。主要之前如果這么寫,好像也不合適。因為在這輪文心大模型4.5系列模型開源之前,百度在Hugging Face上并沒有開源過任何自己的私有模型。
百度在開閉源問題上的態(tài)度轉(zhuǎn)變,是突如其來的,也是自上而下的。因為只有自上而下的指令傳遞,只有李彥宏本人的高度重視和全面部署,百度的AI團隊才能在短時間內(nèi)開創(chuàng)出開源工作的大好局面。
從規(guī)模上看,百度的這次開源很有誠意。一次性放出了10款模型,參數(shù)量從最大的424B到最小的0.3B都有,全面覆蓋多模態(tài)和文本,工作量非常飽和。
官方給出的相關基準測試數(shù)據(jù)顯示,這系列模型性能優(yōu)于DeepSeek-V3等產(chǎn)品,并在多個方面相較于SOTA有顯著提升。
從二月份宣布消息,到今天如期發(fā)布,承諾終于兌現(xiàn)。
MEG 30號當天搞了個金點子夜市,Robin被人拍到現(xiàn)身百度科技園,心情大概還是比較奈斯。
![]()
只不過即便模型跑分跟實際表現(xiàn)相符,也算不上是個大新聞,遠到不了DeepSeek當時放衛(wèi)星的程度。
我有個本科同學CVPR2025中了三篇,前不久剛從Nashville回來。我微信上問他對文心開源這事怎么看,他謙虛說自己不夠格評價。后面又補了兩句,“但百度應該沒人用吧”,“現(xiàn)在討論大模型基本不考慮文心了”。
1.文心大模型來的晚了一些
首先我們先看下文心這次開源的模型水平。
文心網(wǎng)站上,有公布性能和基準測試結果。
官方的技術報告里,旗艦模型300B-A47B在大部分測試類別中,都實現(xiàn)了比Qwen3、DeepSeek-V3和GPT-4.1更好的表現(xiàn)。
![]()
但眾所周知,由于Meta在Llama 4發(fā)布的時候拉了坨大的,現(xiàn)在對于官方公布的跑分結果通常直接搞有罪推定。
從大模型觀測員等第三方評測結果看,這次的文心大模型4.5系列,跟現(xiàn)有的旗艦開源模型如DeepSeek R1、Qwen 3等相比仍有差距。
![]()
該賬號主理人toyama nao在知乎上說,初版短評寫的“推開開源大門”,后面覺得還是用“輕敲”更合適。顯然,中規(guī)中矩、沒有驚喜是對這系列文心模型較為合適的客觀評價。
![]()
但一個中規(guī)中矩、沒有驚喜的模型,在當下的開源環(huán)境中,能給百度帶來的助益必然相當有限。
大模型領域跟傳統(tǒng)的互聯(lián)網(wǎng)行業(yè)一樣,也是趨向于贏家通吃的寡頭格局。
作為用戶,你不會想用一個技術上落后的產(chǎn)品,因為你可以很容易地切換到更好更優(yōu)秀的模型,而且不會有任何其他方面體驗上的損失。
如果進一步將考慮范圍縮小到開源社區(qū),一個普通的中規(guī)中矩的模型所擁有的空間會更加逼仄。
對于開發(fā)者或者企業(yè)而言,免費的比你好的選擇那么多,為啥要選擇一個差強人意的?
開源社區(qū)的空間很大,但不可能容得下每個企業(yè)。
開源大模型領域的發(fā)展大致可以分成三個階段。
階段一:ChatGPT剛剛發(fā)布,沒有任何競品,開源社區(qū)零基礎。
階段二:Meta發(fā)布Llama,實現(xiàn)了開源模型的從無到有,但這個時候開源跟閉源仍然差距巨大。
階段三:DeepSeek發(fā)布R1,開源閉源模型差距大大縮小,形成了開源緊追閉源的心理預期。
事實上,當我們從階段二跨越到階段三這個階段后,隨著開源社區(qū)模型選擇的多樣化,行業(yè)的主要矛盾也從“無模可用”到“無先進模型可用”的階段。
在這個階段,你發(fā)一些中等水平的模型,已經(jīng)不具有太大的意義,因為沒人在意。
只能說文心系列模型的開源來得晚了一些。如果百度去年這個時候做這事,估計還能掀起點浪花。
只不過去年這個時候,李彥宏還在繼續(xù)輸出“暴論”,批判開源模型是智商稅。
李彥宏選擇開源,背后的考量是很清楚的。
百度之所以最初開始選擇閉源,是預期自己能想OpenAI那樣,建立技術實力上的勢能差。
我可能打不過OpenAI,但OpenAI在國外,對國內(nèi)的市場格局影響不大。
我只要做到比國內(nèi)的競爭對手優(yōu)秀就行,類似于當初做搜索的邏輯。
但做著做著,李彥宏發(fā)現(xiàn)百度不只是做不過國外的競對,連國內(nèi)同行都一個二個在超越自己,情況屬實是有些危急了。
所以哪怕被打臉,也還是決定轉(zhuǎn)向開源。
開源一方面可以賺吆喝,就像DeepSeek和阿里云那樣,讓別人認可你的技術實力,科技企業(yè)嘛,還是需要搞點技術增光添彩的。
其次是可以賺銀子,像文心大模型肯定在百度自己的基礎設施上跑出來的效果最好,通義系列肯定上阿里云更方便更有效率,通過建立生態(tài)提供服務的方式賺錢。
最后,開源還有個好處,就是可以相對客觀地獲得有關自身模型的技術反饋,這樣可以倒逼企業(yè)提高研發(fā)水平,拿出更有力度的產(chǎn)品。
由于前兩個因素都需要有技術領先作為基礎,目前來看百度這次的發(fā)布最多只能在第三點上有點效果。
2.開源閉源不只是個技術問題
業(yè)內(nèi)關于開源和閉源兩條路線的爭論很多,兩邊都有各自的道理。
從用戶的角度說,當然是希望開源模型的數(shù)量越多越好、性能指標越高越好。開源模型可以給社區(qū)提供技術養(yǎng)分,同時也能借助社區(qū)力量加速迭代進步,實現(xiàn)技術反哺,構成良性循環(huán)。
當然最重要的,大語言模型已經(jīng)并且正在成為數(shù)字性基礎設施,開源模型可以保證所有人對這項技術的可獲得性。
OpenAI和Anthropic封的號比PUBG還多,就是個很好的提醒。
但對于企業(yè)來說,大模型的研發(fā)和訓練需要投入巨量的成本,這些成本需要有渠道能cover,才能實現(xiàn)長期的可持續(xù)性。以閉源的形式,提供排他性的產(chǎn)品服務,然后從中獲取營收是個更合適的路子。
雖然到目前為止,即便是OpenAI也還沒能證明這條道路在財務指標上的可行性,去年一年其虧損額達到50億美元。
因此,開源閉源不只是個技術問題。
然而,就百度來說,這個問題還因為牽涉到李彥宏本人而更加復雜化了。
在國內(nèi)這么多家互聯(lián)網(wǎng)公司創(chuàng)始人里,李彥宏是外界普遍認知里最技術范的。
這跟百度的歷史有關。搜索引擎是個技術含量很高的領域,而李彥宏本人就是“超鏈分析技術”專利的持有者。當然,除開創(chuàng)立百度早期,李彥宏后面十幾年里作為CEO應該基本沒再深度參與百度的技術研發(fā)了。
但李彥宏仍然是百度的技術圖騰,這在大模型到來后尤為明顯。
其他公司會有技術相關的負責人拋頭露面,但百度這邊幾乎所有重磅的模型或者產(chǎn)品都是李彥宏本人站臺。開源和閉源的戰(zhàn)略調(diào)整,也被認為是李彥宏基于自身的技術認知和品味,在做技術路線上的關鍵選擇。
當我們回顧百度在開源閉源上的態(tài)度變化時,實際就是在看李彥宏本人的合訂本。
2024年4月16日,李彥宏:開源模型會越來越落后。
2024年7月5日,李彥宏:開源模型是智商稅。
2025年2月8日,百度文小言宣布接入deepseek。
2025年2月14日,定了,文心下一代模型開源!
作為公司最高決策者,你當然可以隨時做出開源或者閉源的決定,然后讓下面的人去執(zhí)行。但執(zhí)行的結果和下面的人對你的判斷,你是沒辦法控制的。
作為技術型CEO,你沒做好戰(zhàn)略管理,沒能精確地鎖定某個新興行業(yè)并拿下市場份額,這雖然面子上有點掛不住,但在公眾和員工那里是有諒解理由的。
做技術的嘛,在其他方面眼光不夠敏銳,還是情有可原的,本來尋找第二曲線這事就不容易。更何況公司在正常運營,百度的現(xiàn)金流還穩(wěn)穩(wěn)的,沒有大規(guī)模的裁員或者降薪,日子正常在過。
但在技術問題上,你前期信誓旦旦紅口白牙語出驚人,后面又來360度大反轉(zhuǎn),-1-2夸你有決斷敢拍板不怕打臉,但員工真實心理會怎么想呢?
他們只會覺得你的技術品味和方向判斷能力有很大問題。外部的人最多只是嘲笑調(diào)侃聊作談資,但內(nèi)部的研發(fā)團隊士氣會受到實打?qū)嵉拇驌簟?/p>
說到底,開源閉源是技術路線的選擇,但絕不只是個技術問題。
今天中午有個新消息,百度創(chuàng)始人李彥宏發(fā)布內(nèi)部信,宣布了新一輪組織調(diào)整:
何海建(Henry)正式加盟百度,擔任集團公司首席財務官(CFO),負責百度財務體系管理工作。集團資深副總裁何俊杰(Jackson)不再擔任代理CFO職務,輪崗負責集團人力資源及行政管理。
輪崗是個很有百度特色的制度,后面有機會可以專門寫一篇。
輪崗這事不罕見,很多企業(yè)都有,但一般都是中基層崗位,比如銀行管培生都需要在不同部門實習跑一圈,熟悉下業(yè)務。百度不一樣,百度輪崗輪的是最高管理層那批人。
官方語境里,輪崗是為了激發(fā)組織的創(chuàng)新與活力。
輪崗到底有沒有激發(fā)百度的組織活力我不知道,起碼目前來說,效果不是很明顯。但輪崗在事實上造成了一個結果:強化了李彥宏和百度之間的同一性。(后續(xù)會針對百度組織架構進行拆解)
這只會加劇我們上面所說的那個問題。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.