![]()
文:王智遠 | ID:Z201440
老羅最新一期采訪 MiniMax 閆俊杰的播客,四個小時,終于稀稀拉拉聽完了。
聽完后,也就沒然后了;畢竟信息在腦中過去,猶如刮風一樣絲滑,左耳朵進右耳朵出。所以,我又把播客下載下來,轉換成文字,死磕了一遍。
這一遍,讓我對閆俊杰的表達,有了新的認識。
如果說羅永浩代表古典互聯網時代對“產品”和“情懷”的追求,那閆俊杰展示了一種全新的、甚至帶著一點非人感的物種。
你看他溫吞、佛系,甚至有點遲鈍,但在這張毫無攻擊性的外表下,藏著一套近乎冷酷的操作系統。
01
為什么我要下這個結論?復盤 MiniMax 的三年,我看到的第一個關鍵詞,是「去魅」。
咱們平時看那些 AI 大佬,要么極客范兒十足,要么滿嘴改變世界的精英,但在老羅的直播間里,閆俊杰太“素”了。
發際線有點高,人有點微胖,甚至在公司里,大家居然管他叫“中登”,意思就是“長相中等登樣” 。你可能覺得這人挺逗、挺佛系;但細品他在訪談里說的一個細節,就大有不同了。
他說為了減肥,去打了司美格魯肽。打完之后,食欲沒了。他的原話是:感覺自己變成了圣人。
大家聽了可能哈哈一笑,覺得是幽默。但在我眼里,這簡直是一個狠人的隱喻,一個為了達成目標,可以隨時修改自己身體參數的人。
這種對欲望的剝離,一旦用到公司管理上,就是一種極度可怕的理性。
你看他對危機的反應,完全不像個正常的碳基生物,當初硅谷銀行倒閉,MiniMax 所有錢都在里面,眼看要發不出工資了;換一般創業者,這會兒估計早就崩潰了,或者至少得焦慮得睡不著覺吧?
閆俊杰沒有。
他的回憶里,沒有一絲驚慌失措,他說,這事兒既然發生了,那就別浪費時間去難受了,趕緊算算怎么活下來,怎么把損失降到最低 。
再看他對競爭對手的態度。
今年 DeepSeek 火成那樣,把大家臉都打腫了;正常人心里多少得有點酸吧?有點“既生瑜何生亮”的不甘心吧?
他沒有。他淡淡地來了句:我不嫉妒……我覺得是他們應得的。這哪像人在說話啊?這簡直是一臺服務器在輸出計算結果,在他那套操作系統里,好像根本就沒有情緒這個模塊。
他在訪談里老說自己“認知不夠”,還會自我 PUA。這話翻譯成大白話是:我的模型沒跑好,誤差變大了。
誤差變大了怎么辦?哭有用嗎?沒用。你得趕緊找找是哪層參數設錯了,把權重改過來,然后接著跑,這就是第一代 AI Native CEO 最嚇人的地方。
他不跟你演什么熱血沸騰的創業故事,把自己活成了一個沒有感情的“算力節點”,輸入信息,算出最優解,然后執行。
所以,我說,看著佛系,其實是“情緒參數歸零”,這種人,才是最難被擊敗的。
02
既然有了這么一顆“莫得感情”的 CPU,那 1989 年出生的閆俊杰做出來的決定,自然就不可能按常理出牌。
常理是什么?迷信大牛,迷信硅谷光環,是我們要聚焦,但他這套系統啟動后的第一步,竟然不同。
哪里不同呢?
先說人。回想一下 2021 年那會兒,AI 圈子都在搶什么人?各家公司都在搶大廠高管、海歸的博士、搶自帶光環的“明星科學家”,那可是“諸神之戰”。
好像誰家沒幾個 Google、微軟回來的大神,都不好意思跟投資人打招呼。
但 MiniMax 呢?簡直是“草臺班子”。閆俊杰找了一幫什么人?一幫年輕得不像話的生瓜蛋子。外界甚至吐槽,這團隊配置也太素了,連個能鎮住場子的海歸大牛都找不到。
是請不起嗎?肯定不是。
閆俊杰在訪談里說了一句比較扎心的話:我覺得之前的經歷很多東西是沒用的……甚至很多傳統 AI 的經驗是相悖的。
這就很有意思了。在咱們看來,經驗是寶貴的財富;但在他的算法里,這叫過擬合 (Overfitting)。
你想啊,舊時代專家,腦子里裝的都是上一代參數,他們太懂怎么調優一個小模型,太懂怎么做一個人臉識別了,但在 AGI 這個新物種面前,這些舊權重反而成了偏見,成了阻礙。
反倒年輕人,沒經驗,也沒被污染,他們就像一張沒被訓練過的顯卡,算力純凈,可塑性極強。
他還搞出了“實習生也有實習生”的操作。讓 AI Agent(智能體)去給實習生打下手,干寫代碼、修 Bug 的臟活累活,這哪是招人,這分明在搭建一個人機混合的算力集群。
除了人,還有事兒。如果別的創業公司,投資人肯定會按著頭讓你“聚焦”,你一個小公司,資源有限,先把文本模型搞好行不行?
但閆俊杰偏不。
他一上來搞了個“全家桶”:語音、文本、視頻,我全都要;在當時看來,這簡直找死,不僅違反了商業教材里的定位理論,也違反了創業公司的資源約束。
那他為什么要這么干呢?因為他信物理學里的 Scaling Law(規模定律) 。
在他的算法里,Scaling Law 有個前提,你的輸入數據必須是完備的;你想想,人類怎么感知世界的?不光靠讀文字,更得靠聽、靠看。
如果我們想要造出真正的 AGI(通用人工智能),卻只給它喂文字,那就像想培養一個天才,卻先把他的眼睛蒙上、耳朵堵上。這在物理上就不可能收斂到人類智能這個全局最優解。
既然終局一定是多模態融合,那為什么要為了短期的“容易”,去造一個“殘疾”的模型呢?
所以,在訪談里,他特淡定地說,做語音、做視頻當時看起來很蠢,甚至做了兩年語言模型都沒啥直接產出,但只要目標函數是對的,中間的虧,都為了收斂到全局最優解所付出的代價。
03
參數(人)找齊了,目標(多模態)也定好了,怎么讓這幾百號“生瓜蛋子”,像一顆大腦一樣精密運轉?
按照熟悉的互聯網大廠邏輯,這時該上“管理手段”了,定 OKR、搞賽馬機制、建中臺、設層級,這也是很多大廠最引以為傲的“屠龍術”,但閆俊杰把這些通通扔進了垃圾桶。
他在訪談里有點凡爾賽地說:我們公司沒有 OKR,也試過,發現根本行不通。
為什么行不通?
這要回到理工男的腦回路了。在他眼里,公司是一個巨大的、待優化的函數。傳統OKR 是什么?我知道橋在河對面,咱們拆解一下怎么搭橋,那是確定性環境下的工程管理。
但在 AI 這個無人區,前面是一片迷霧,根本不知道橋在哪。這時定 OKR,就是瞎指揮。
那 MiniMax 靠什么管人?
靠算法,全公司最核心的會議,叫CD 會這個詞兒聽著挺玄乎,其實是數學術語 Coordinate Descent(坐標下降法)的縮寫 。
啥意思呢?
在多維空間里,我們不知道最低點(最優解)在哪,但可以讓每個人(每個坐標)輪流調整,每次調整都讓整體的 Loss(誤差) 往下降一點點。
智遠認為,這是一套極度理性的“硅基管理哲學”。
第一,消滅了中間商。
傳統公司里,產品經理是干啥的?寫文檔(PRD)、畫原型、催開發;但在 MiniMax,這套流程太慢了。
閆俊杰要求,產品經理得自己能寫代碼,能做 Demo,因為在神經網絡里,神經元之間是直接傳遞信號的,不需要一個翻譯官在中間傳話。
那些只懂“協調資源”的中間層,在這個系統里就是增加了延遲(Latency),必須被優化掉。
第二,殘酷的“剪枝”。
這套系統聽著很美好,運作起來很冷酷;我記得前段時間看一個報道說,MiniMax 高管流動性很大,甚至有早期合伙人被請走。
咱們看來,這叫內斗或者動蕩,而閆俊杰的算法里,這叫剪枝(Pruning)。
如果一個參數(員工)的調整,始終不能讓全局的 Loss 下降,甚至導致了模型發散(團隊內耗),那么,不管他資歷多老,在這個函數里,他就是無效變量,必須歸零。
所以,你看 MiniMax 的組織,既沒有大廠溫情脈脈的家文化,也沒有打雞血的兄弟文化,它更像一個高壓運轉的計算集群。
每個人是一個變量,大家不看臉色,不看 PPT,只看一件事:每一次迭代,有沒有讓那個該死的 Loss 值往下降一點?
這就是 AI Native 公司的真面目:極致扁平,極致效率,以及,呃……極致的無情。
04
既然這套“硅基管理系統”這么厲害,是不是就無敵了?
并沒有。
這臺精密的機器在 2024 年上半年,也差點死機;那是 MiniMax 最糾結的一段時間;雖然Talkie在海外火了,但也讓整個公司染上了一種互聯網舊勢力的病毒。
那就是,追求虛榮指標(Vanity Metrics),閆俊杰說,那時,投資人天天盯著問 DAU(日活),公司內部開始瘋狂討論投流、買量、留存。
這好比一個本來要練神功的武林高手,突然跑去練胸口碎大石了,因為來錢快,觀眾愛看,而且,這個時刻DeepSeek(深度求索) 橫空出世了。
DeepSeek 干了什么?
沒買量,沒做復雜的App,靠一個強得離譜的模型,幾天之內用戶量炸裂,把所有還在卷投流的公司(包括 Kimi,也包括 MiniMax)臉都打腫了,這種行為,間歇性給MiniMax一個大嘴巴子。
他既沒有像有的同行那樣,在那兒憤憤不平地算 DeepSeek 到底虧了多少錢,也沒有像有的巨頭那樣假裝看不見繼續硬推,而是,把大嘴巴子識別為了一個極為寶貴的誤差信號。
那MiniMax干了什么事兒呢?
一,砍掉胸口碎大石的項目:為了堆產品功能、為了虛榮指標而分散算力的項目(比如那個類似“即夢”的視頻產品),直接停掉。
二,修正權重:既然智能才是核心,那就把算力從運營那里搶回來,重新 All-in 到數學、編程這些最硬核的基礎能力上。
三,認錯迭代:在訪談里他坦然承認自己“認知不夠”,這叫根據最新的誤差值,更新了自己的參數。
很多人覺得 DeepSeek 是 MiniMax 的對手。但智遠看來,DeepSeek 更像 MiniMax 這個神經網絡的一次強效“梯度修正”。
如果沒有被打臉,MiniMax還在互聯網流量思維的局部最優解里打轉。正是這種修正,證明了閆俊杰這套系統的“魯棒性” (Robustness) 。
一個優秀的系統,當巨大的外部沖擊到來時,它能接受對手的啟發,瞬間完成自我糾錯。
05
一顆莫得感情的 CPU(閆俊杰),帶著一堆沒被舊時代染過色的生瓜蛋子(年輕人),跑著一套只看結果、不講面子的算法(CD會),最后,還得加上臉被打腫了、下一秒就能立馬調頭的狠勁兒(糾錯機制)。
這確實是一個能夠在這個亂世中活下來、甚至跑得很快的新物種。
但復盤最后,我不得不面對那個最扎心的問題,也是羅永浩在訪談里反復追問、甚至有點焦慮的問題:如果公司都變成了這樣,那我們人類,比如:產品經理、中層管理者,在這個系統里還有位置嗎?
閆俊杰回答很含蓄,他說邊界會模糊,說大家都要懂技術。 但在我看來,這層窗戶紙捅破了極其殘酷:因為傳統的中間層,注定消亡。
在羅永浩的古典認知里,產品經理是“我有想法,工程師來實現”的人,是負責“指揮”的;但在閆俊杰的算法里,這個協調者的角色權重,正在無限趨近于零。
為什么?
因為他要求產品經理得自己做 Demo,自己寫代碼;在 AI 賦能的組織里,“想法”到“實現”的路徑被無限壓縮了;以前需要一個部門、開五次會才能干完的事,現在一個超級個體+ AI就能干完。
所以,智遠認為,未來公司組織,大概率會收斂成一種“啞鈴型結構”:
一端是“架構師”,像閆俊杰這樣,負責定義目標函數(Target Function),負責設計系統如何運轉,負責在至暗時刻計算生路。
一端是“超級節點”:能夠直接利用 AI 產出結果的個體,或者是能提供高質量數據(Data)的人,哪怕你是寫小說的、畫畫的,只要你有原創性,你就是高權重的參數。
而夾在中間靠傳遞信息、協調資源、管理情緒為生的科層制管理者,將被系統無情地剪枝。
這聽起來很悲觀嗎?
訪談最后,閆俊杰提到了特德·姜的小說《軟件體的生命周期》;那是一個關于人類如何與數字生命共存、共同進化的故事,或許,這就是一場“物種進化”。
MiniMax 的三年,不僅是一家創業公司的突圍史,更是一份未來組織的生存實驗報告。
它告訴我們,在 AI 時代,想要不被組織系統優化掉,唯一的辦法,成為那個定義算法的人,要么,讓自己也進化成系統的一部分。
至于還抱著舊地圖、沉溺于中間管理的人,抱歉,系統對齊的函數里,容不下噪音;羅永浩用生意思維,巧妙地把這套冷酷但有效的生存邏輯給“聊”了出來。
有意思。產品底層是模型,把模型做好,剩下的,都只是渠道。以上,僅代表智遠個人看法。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.