![]()
文:王智遠(yuǎn) | ID:Z201440
老羅最新一期采訪 MiniMax 閆俊杰的播客,四個小時,終于稀稀拉拉聽完了。
聽完后,也就沒然后了;畢竟信息在腦中過去,猶如刮風(fēng)一樣絲滑,左耳朵進(jìn)右耳朵出。所以,我又把播客下載下來,轉(zhuǎn)換成文字,死磕了一遍。
這一遍,讓我對閆俊杰的表達(dá),有了新的認(rèn)識。
如果說羅永浩代表古典互聯(lián)網(wǎng)時代對“產(chǎn)品”和“情懷”的追求,那閆俊杰展示了一種全新的、甚至帶著一點非人感的物種。
你看他溫吞、佛系,甚至有點遲鈍,但在這張毫無攻擊性的外表下,藏著一套近乎冷酷的操作系統(tǒng)。
01
為什么我要下這個結(jié)論?復(fù)盤 MiniMax 的三年,我看到的第一個關(guān)鍵詞,是「去魅」。
咱們平時看那些 AI 大佬,要么極客范兒十足,要么滿嘴改變世界的精英,但在老羅的直播間里,閆俊杰太“素”了。
發(fā)際線有點高,人有點微胖,甚至在公司里,大家居然管他叫“中登”,意思就是“長相中等登樣” 。你可能覺得這人挺逗、挺佛系;但細(xì)品他在訪談里說的一個細(xì)節(jié),就大有不同了。
他說為了減肥,去打了司美格魯肽。打完之后,食欲沒了。他的原話是:感覺自己變成了圣人。
大家聽了可能哈哈一笑,覺得是幽默。但在我眼里,這簡直是一個狠人的隱喻,一個為了達(dá)成目標(biāo),可以隨時修改自己身體參數(shù)的人。
這種對欲望的剝離,一旦用到公司管理上,就是一種極度可怕的理性。
你看他對危機的反應(yīng),完全不像個正常的碳基生物,當(dāng)初硅谷銀行倒閉,MiniMax 所有錢都在里面,眼看要發(fā)不出工資了;換一般創(chuàng)業(yè)者,這會兒估計早就崩潰了,或者至少得焦慮得睡不著覺吧?
閆俊杰沒有。
他的回憶里,沒有一絲驚慌失措,他說,這事兒既然發(fā)生了,那就別浪費時間去難受了,趕緊算算怎么活下來,怎么把損失降到最低 。
再看他對競爭對手的態(tài)度。
今年 DeepSeek 火成那樣,把大家臉都打腫了;正常人心里多少得有點酸吧?有點“既生瑜何生亮”的不甘心吧?
他沒有。他淡淡地來了句:我不嫉妒……我覺得是他們應(yīng)得的。這哪像人在說話啊?這簡直是一臺服務(wù)器在輸出計算結(jié)果,在他那套操作系統(tǒng)里,好像根本就沒有情緒這個模塊。
他在訪談里老說自己“認(rèn)知不夠”,還會自我 PUA。這話翻譯成大白話是:我的模型沒跑好,誤差變大了。
誤差變大了怎么辦?哭有用嗎?沒用。你得趕緊找找是哪層參數(shù)設(shè)錯了,把權(quán)重改過來,然后接著跑,這就是第一代 AI Native CEO 最嚇人的地方。
他不跟你演什么熱血沸騰的創(chuàng)業(yè)故事,把自己活成了一個沒有感情的“算力節(jié)點”,輸入信息,算出最優(yōu)解,然后執(zhí)行。
所以,我說,看著佛系,其實是“情緒參數(shù)歸零”,這種人,才是最難被擊敗的。
02
既然有了這么一顆“莫得感情”的 CPU,那 1989 年出生的閆俊杰做出來的決定,自然就不可能按常理出牌。
常理是什么?迷信大牛,迷信硅谷光環(huán),是我們要聚焦,但他這套系統(tǒng)啟動后的第一步,竟然不同。
哪里不同呢?
先說人。回想一下 2021 年那會兒,AI 圈子都在搶什么人?各家公司都在搶大廠高管、海歸的博士、搶自帶光環(huán)的“明星科學(xué)家”,那可是“諸神之戰(zhàn)”。
好像誰家沒幾個 Google、微軟回來的大神,都不好意思跟投資人打招呼。
但 MiniMax 呢?簡直是“草臺班子”。閆俊杰找了一幫什么人?一幫年輕得不像話的生瓜蛋子。外界甚至吐槽,這團(tuán)隊配置也太素了,連個能鎮(zhèn)住場子的海歸大牛都找不到。
是請不起嗎?肯定不是。
閆俊杰在訪談里說了一句比較扎心的話:我覺得之前的經(jīng)歷很多東西是沒用的……甚至很多傳統(tǒng) AI 的經(jīng)驗是相悖的。
這就很有意思了。在咱們看來,經(jīng)驗是寶貴的財富;但在他的算法里,這叫過擬合 (Overfitting)。
你想啊,舊時代專家,腦子里裝的都是上一代參數(shù),他們太懂怎么調(diào)優(yōu)一個小模型,太懂怎么做一個人臉識別了,但在 AGI 這個新物種面前,這些舊權(quán)重反而成了偏見,成了阻礙。
反倒年輕人,沒經(jīng)驗,也沒被污染,他們就像一張沒被訓(xùn)練過的顯卡,算力純凈,可塑性極強。
他還搞出了“實習(xí)生也有實習(xí)生”的操作。讓 AI Agent(智能體)去給實習(xí)生打下手,干寫代碼、修 Bug 的臟活累活,這哪是招人,這分明在搭建一個人機混合的算力集群。
除了人,還有事兒。如果別的創(chuàng)業(yè)公司,投資人肯定會按著頭讓你“聚焦”,你一個小公司,資源有限,先把文本模型搞好行不行?
但閆俊杰偏不。
他一上來搞了個“全家桶”:語音、文本、視頻,我全都要;在當(dāng)時看來,這簡直找死,不僅違反了商業(yè)教材里的定位理論,也違反了創(chuàng)業(yè)公司的資源約束。
那他為什么要這么干呢?因為他信物理學(xué)里的 Scaling Law(規(guī)模定律) 。
在他的算法里,Scaling Law 有個前提,你的輸入數(shù)據(jù)必須是完備的;你想想,人類怎么感知世界的?不光靠讀文字,更得靠聽、靠看。
如果我們想要造出真正的 AGI(通用人工智能),卻只給它喂文字,那就像想培養(yǎng)一個天才,卻先把他的眼睛蒙上、耳朵堵上。這在物理上就不可能收斂到人類智能這個全局最優(yōu)解。
既然終局一定是多模態(tài)融合,那為什么要為了短期的“容易”,去造一個“殘疾”的模型呢?
所以,在訪談里,他特淡定地說,做語音、做視頻當(dāng)時看起來很蠢,甚至做了兩年語言模型都沒啥直接產(chǎn)出,但只要目標(biāo)函數(shù)是對的,中間的虧,都為了收斂到全局最優(yōu)解所付出的代價。
03
參數(shù)(人)找齊了,目標(biāo)(多模態(tài))也定好了,怎么讓這幾百號“生瓜蛋子”,像一顆大腦一樣精密運轉(zhuǎn)?
按照熟悉的互聯(lián)網(wǎng)大廠邏輯,這時該上“管理手段”了,定 OKR、搞賽馬機制、建中臺、設(shè)層級,這也是很多大廠最引以為傲的“屠龍術(shù)”,但閆俊杰把這些通通扔進(jìn)了垃圾桶。
他在訪談里有點凡爾賽地說:我們公司沒有 OKR,也試過,發(fā)現(xiàn)根本行不通。
為什么行不通?
這要回到理工男的腦回路了。在他眼里,公司是一個巨大的、待優(yōu)化的函數(shù)。傳統(tǒng)OKR 是什么?我知道橋在河對面,咱們拆解一下怎么搭橋,那是確定性環(huán)境下的工程管理。
但在 AI 這個無人區(qū),前面是一片迷霧,根本不知道橋在哪。這時定 OKR,就是瞎指揮。
那 MiniMax 靠什么管人?
靠算法,全公司最核心的會議,叫CD 會這個詞兒聽著挺玄乎,其實是數(shù)學(xué)術(shù)語 Coordinate Descent(坐標(biāo)下降法)的縮寫 。
啥意思呢?
在多維空間里,我們不知道最低點(最優(yōu)解)在哪,但可以讓每個人(每個坐標(biāo))輪流調(diào)整,每次調(diào)整都讓整體的 Loss(誤差) 往下降一點點。
智遠(yuǎn)認(rèn)為,這是一套極度理性的“硅基管理哲學(xué)”。
第一,消滅了中間商。
傳統(tǒng)公司里,產(chǎn)品經(jīng)理是干啥的?寫文檔(PRD)、畫原型、催開發(fā);但在 MiniMax,這套流程太慢了。
閆俊杰要求,產(chǎn)品經(jīng)理得自己能寫代碼,能做 Demo,因為在神經(jīng)網(wǎng)絡(luò)里,神經(jīng)元之間是直接傳遞信號的,不需要一個翻譯官在中間傳話。
那些只懂“協(xié)調(diào)資源”的中間層,在這個系統(tǒng)里就是增加了延遲(Latency),必須被優(yōu)化掉。
第二,殘酷的“剪枝”。
這套系統(tǒng)聽著很美好,運作起來很冷酷;我記得前段時間看一個報道說,MiniMax 高管流動性很大,甚至有早期合伙人被請走。
咱們看來,這叫內(nèi)斗或者動蕩,而閆俊杰的算法里,這叫剪枝(Pruning)。
如果一個參數(shù)(員工)的調(diào)整,始終不能讓全局的 Loss 下降,甚至導(dǎo)致了模型發(fā)散(團(tuán)隊內(nèi)耗),那么,不管他資歷多老,在這個函數(shù)里,他就是無效變量,必須歸零。
所以,你看 MiniMax 的組織,既沒有大廠溫情脈脈的家文化,也沒有打雞血的兄弟文化,它更像一個高壓運轉(zhuǎn)的計算集群。
每個人是一個變量,大家不看臉色,不看 PPT,只看一件事:每一次迭代,有沒有讓那個該死的 Loss 值往下降一點?
這就是 AI Native 公司的真面目:極致扁平,極致效率,以及,呃……極致的無情。
04
既然這套“硅基管理系統(tǒng)”這么厲害,是不是就無敵了?
并沒有。
這臺精密的機器在 2024 年上半年,也差點死機;那是 MiniMax 最糾結(jié)的一段時間;雖然Talkie在海外火了,但也讓整個公司染上了一種互聯(lián)網(wǎng)舊勢力的病毒。
那就是,追求虛榮指標(biāo)(Vanity Metrics),閆俊杰說,那時,投資人天天盯著問 DAU(日活),公司內(nèi)部開始瘋狂討論投流、買量、留存。
這好比一個本來要練神功的武林高手,突然跑去練胸口碎大石了,因為來錢快,觀眾愛看,而且,這個時刻DeepSeek(深度求索) 橫空出世了。
DeepSeek 干了什么?
沒買量,沒做復(fù)雜的App,靠一個強得離譜的模型,幾天之內(nèi)用戶量炸裂,把所有還在卷投流的公司(包括 Kimi,也包括 MiniMax)臉都打腫了,這種行為,間歇性給MiniMax一個大嘴巴子。
他既沒有像有的同行那樣,在那兒憤憤不平地算 DeepSeek 到底虧了多少錢,也沒有像有的巨頭那樣假裝看不見繼續(xù)硬推,而是,把大嘴巴子識別為了一個極為寶貴的誤差信號。
那MiniMax干了什么事兒呢?
一,砍掉胸口碎大石的項目:為了堆產(chǎn)品功能、為了虛榮指標(biāo)而分散算力的項目(比如那個類似“即夢”的視頻產(chǎn)品),直接停掉。
二,修正權(quán)重:既然智能才是核心,那就把算力從運營那里搶回來,重新 All-in 到數(shù)學(xué)、編程這些最硬核的基礎(chǔ)能力上。
三,認(rèn)錯迭代:在訪談里他坦然承認(rèn)自己“認(rèn)知不夠”,這叫根據(jù)最新的誤差值,更新了自己的參數(shù)。
很多人覺得 DeepSeek 是 MiniMax 的對手。但智遠(yuǎn)看來,DeepSeek 更像 MiniMax 這個神經(jīng)網(wǎng)絡(luò)的一次強效“梯度修正”。
如果沒有被打臉,MiniMax還在互聯(lián)網(wǎng)流量思維的局部最優(yōu)解里打轉(zhuǎn)。正是這種修正,證明了閆俊杰這套系統(tǒng)的“魯棒性” (Robustness) 。
一個優(yōu)秀的系統(tǒng),當(dāng)巨大的外部沖擊到來時,它能接受對手的啟發(fā),瞬間完成自我糾錯。
05
一顆莫得感情的 CPU(閆俊杰),帶著一堆沒被舊時代染過色的生瓜蛋子(年輕人),跑著一套只看結(jié)果、不講面子的算法(CD會),最后,還得加上臉被打腫了、下一秒就能立馬調(diào)頭的狠勁兒(糾錯機制)。
這確實是一個能夠在這個亂世中活下來、甚至跑得很快的新物種。
但復(fù)盤最后,我不得不面對那個最扎心的問題,也是羅永浩在訪談里反復(fù)追問、甚至有點焦慮的問題:如果公司都變成了這樣,那我們?nèi)祟悾热纾寒a(chǎn)品經(jīng)理、中層管理者,在這個系統(tǒng)里還有位置嗎?
閆俊杰回答很含蓄,他說邊界會模糊,說大家都要懂技術(shù)。 但在我看來,這層窗戶紙捅破了極其殘酷:因為傳統(tǒng)的中間層,注定消亡。
在羅永浩的古典認(rèn)知里,產(chǎn)品經(jīng)理是“我有想法,工程師來實現(xiàn)”的人,是負(fù)責(zé)“指揮”的;但在閆俊杰的算法里,這個協(xié)調(diào)者的角色權(quán)重,正在無限趨近于零。
為什么?
因為他要求產(chǎn)品經(jīng)理得自己做 Demo,自己寫代碼;在 AI 賦能的組織里,“想法”到“實現(xiàn)”的路徑被無限壓縮了;以前需要一個部門、開五次會才能干完的事,現(xiàn)在一個超級個體+ AI就能干完。
所以,智遠(yuǎn)認(rèn)為,未來公司組織,大概率會收斂成一種“啞鈴型結(jié)構(gòu)”:
一端是“架構(gòu)師”,像閆俊杰這樣,負(fù)責(zé)定義目標(biāo)函數(shù)(Target Function),負(fù)責(zé)設(shè)計系統(tǒng)如何運轉(zhuǎn),負(fù)責(zé)在至暗時刻計算生路。
一端是“超級節(jié)點”:能夠直接利用 AI 產(chǎn)出結(jié)果的個體,或者是能提供高質(zhì)量數(shù)據(jù)(Data)的人,哪怕你是寫小說的、畫畫的,只要你有原創(chuàng)性,你就是高權(quán)重的參數(shù)。
而夾在中間靠傳遞信息、協(xié)調(diào)資源、管理情緒為生的科層制管理者,將被系統(tǒng)無情地剪枝。
這聽起來很悲觀嗎?
訪談最后,閆俊杰提到了特德·姜的小說《軟件體的生命周期》;那是一個關(guān)于人類如何與數(shù)字生命共存、共同進(jìn)化的故事,或許,這就是一場“物種進(jìn)化”。
MiniMax 的三年,不僅是一家創(chuàng)業(yè)公司的突圍史,更是一份未來組織的生存實驗報告。
它告訴我們,在 AI 時代,想要不被組織系統(tǒng)優(yōu)化掉,唯一的辦法,成為那個定義算法的人,要么,讓自己也進(jìn)化成系統(tǒng)的一部分。
至于還抱著舊地圖、沉溺于中間管理的人,抱歉,系統(tǒng)對齊的函數(shù)里,容不下噪音;羅永浩用生意思維,巧妙地把這套冷酷但有效的生存邏輯給“聊”了出來。
有意思。產(chǎn)品底層是模型,把模型做好,剩下的,都只是渠道。以上,僅代表智遠(yuǎn)個人看法。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.