
他是中國AI 1.0時代的拓荒者,在深度學習黎明前的黑夜,成為全中國第一個復現AlexNet(深度卷積神經網絡模型)、拿到AI“黃金榔頭”的人。
他是地平線創始團隊成員及前智能駕駛總裁,卻在公司2024年成功上市的高光時刻,轉身闖進具身智能的無人區,去驗證物理世界的Scaling Law。
他是Vbot維他動力的創始人,用60人團隊一年量產機器狗,首款智能四足機器人產品發布即引爆,截止1月10日,預訂訂單量已經達到了6540臺,并實現了以C端帶動B端的銷量破局。
他是余軼南博士,Vbot 維他動力創始人兼CEO,他要打造全球領先的消費級機器人產品。
善友教授說:“他是一個典型的‘少數派’”。這位跨越了軟件算法、芯片硬件到機器人本體的“全棧”技術專家,永遠不在主戰場跟人肉搏,而是憑借極高的戰略品味,在每一次技術變革的前夜,精準地站在了未來的入口。
本期「善友探索流」播客,我們邀請到Vbot維他動力創始人兼CEO,同時也是混沌學園六期同學——余軼南博士。在本場深度對談中,余軼南博士貢獻了極具顛覆性的三大商業洞見:
關于生存哲學:硬科技創業不是賭博,而是基于認知的精準判斷。只有“鎖死下限”,才敢去賭那個“無限的上限”。
關于公司本質:AI公司V.S.科技公司,區別不在技術,而在是否追求Scaling Law(尺度定律)帶來的無限增長。
關于組織終局:他用了一個形象又有趣的比喻——“太上老君煉丹”,道破了AI時代的組織真相。未來的公司不需要人海戰術,只需要極少數頂級的“煉丹師”和一群務實的“造爐人”。
以下是播客內容精選,完整版請打開小宇宙app收聽。
![]()
![]()
AI1.0往事:技術信仰的起點
李善友:你簡單說說你的求學、職業經歷以及現在在做什么。
余軼南:2007年至2012年,我在中科院攻讀博士學位,研究方向是人工智能,當時處于AI1.0時代,也可以說是深度學習的早期階段。2012年畢業后,我加入百度,跟隨余凱(地平線創始人兼CEO),趕上了深度學習快速發展的時期。
2015年,地平線創立,我主要負責智能駕駛業務。地平線是一家專注于AI芯片和人工智能軟件算法的公司。我們探索了多個應用場景,包括AIOT、機器人和智能駕駛,最終智能駕駛脫穎而出,成為公司的重要發展方向。2024年底,地平線成功上市,之后我離開地平線,創立了Vbot 維他動力,致力于用AI創新,創造生活空間的機器人。
李善友:你的經歷可以簡單分為三段,第一段是中科院和百度時期,主要是做研究和技術積累;第二段是在地平線,追隨余凱,推動智能駕駛業務的發展;第三段是自己創業,實現自己的理想。
按照這個結構,你先回顧一下第一段,在中科院和百度的研究階段。
余軼南:那時候行業研究的目標是突破技術瓶頸。當時AI領域雖然有多個研究方向,比如圖像識別、語音識別等,但不同領域的技術差異較大。
當時AI還是個小圈子,從業者少,比較冷門,找工作都不容易。直到2012年AlexNet出現,深度學習才開始成為主流。
李善友:AlexNet出現之前,大家的研究狀態是怎樣的呢?
余軼南:在AlexNet出現之前,各個研究方向技術差異大,沒有統一的建模方式。比如圖像識別、目標檢測、文本理解和語音識別等方向,各自有各自的技術方案。
AlexNet出現后,深度學習的建模方式統一了這些領域,就像過去每種釘子都需要不同的錘子去敲,現在一種錘子就能敲各種釘子。這種統一不僅提高了技術的泛化性,還降低了行業的技術壁壘。
李善友:你親歷了這個過程,確實很有價值。你能回憶一下你第一次接觸到 AlexNet,當時是什么樣的反應?
余軼南:AlexNet是在ImageNet競賽中提出的經典模型。2010年的 ImageNet競賽中,余凱拿到了冠軍,那本身就是一項難度極高的成就,ImageNet一直被認為是計算機視覺領域最具挑戰性的任務之一。
但從行業整體來看,當時的技術進展仍然相對緩慢,大家更多是在既有框架下做漸進式優化,普遍能感受到瓶頸的存在。
真正的轉折出現在 2012 年。AlexNet帶來了本質性的性能躍遷,讓這個長期被認為極其困難的任務第一次出現了突破性的解法。所以當 10 月份比賽結果和論文公布時,我們都感到非常震驚。
李善友:你還記得你是怎么得知這個消息的嗎?
余軼南:當時余凱去參加了NIPS會議(神經信息處理系統大會),比賽結果公布時,我們應該屬于春江水暖鴨先知,最早一批得知并理解這一成果的人。
當時我在國內,余凱在北美。我記得那是一個晚上,大概11點或12點,余凱給我發來了比賽結果。我花一個多小時讀完文章后,我覺得這似乎真的可行。
我的第一個反應是,我們需要復現它。于是,我立刻聯系余凱,說我們需要買GPU。
李善友:那時候你就意識到需要GPU了?
余軼南:對,因為文章里提到需要巨大的算力,還提到使用GPU加速了多少倍。當時他們用了兩周時間訓練模型,如果用CPU,根本無法完成。所以,我的第一個反應就是買GPU。
當時,我們想快速推進復現工作,多買了一些。那時候沒有任何現成的代碼,幾乎是從零開始寫代碼。我們一邊讀論文,一邊逐步實現它,難度確實很大。
李善友:今天回頭看,你們是不是全中國甚至全世界第一個復現AlexNet的團隊?
余軼南:我覺得至少在中國肯定是第一個。全世界不好說,但應該也是最早的一批。
李善友:你當時的心情和周圍人的反應如何?尤其是百度內部的反應。
余軼南:當時的感覺就像拿到了一把“黃金榔頭”。這種建模方式非常根本,只要定義好輸入和輸出,它就能發揮巨大的作用。我們意識到這是一把可以解決很多問題的利器。
因為當時百度的業務非常廣泛,涵蓋圖像、語音和自然語言等多個領域。我們想,能不能用這把“黃金榔頭”去解決所有業務中的問題?于是我們真地逐個嘗試了,并給自己設置了標準:新算法的效果至少比傳統算法提升20%以上,才算“敲對”了釘子。
在這個標準下,我們迅速將技術鋪開,用模型自動識別替代低效人工錄入,并支持商品檢索和人臉特效等新功能。甚至在當年,我們就構建了類似今日“基座模型”的雛形,嘗試了早期的“看圖說話”(Image to Caption)與“文生圖”(Caption to Image),用一個通用模型支撐起了全廠的圖像與視頻識別需求。
![]()
面對新技術的底層決策邏輯
李善友:這很有意思。你不僅迅速接受了新技術,還花了兩個月時間將其復現出來。這是你的天賦還是長期積累的素質?
余軼南:我覺得對技術的基本理解應該是:新的東西一定比舊的東西有其獨特的優勢,尤其是那些帶來巨大變革的技術。它一定有本質上的不同。
這是社會發展的規律。如果世界的發展只是沿著過去的路走,那么世界不可能進步。就像兒子總是要走出自己的路,不完全聽從父親的安排。
李善友:但這種“轉變”在你身上其實發生了不止一次。如果這么算,從北郵去中科院讀博,其實也可以算一次重要的轉變。
余軼南:是的,當時是2006年大三下半學期,通信行業非常火爆,北郵的學生找工作時,外企提供的薪水高、工作體面,比如摩托羅拉。而互聯網行業當時還處于起步階段。
但我發現通信行業競爭太激烈,而且外企雖然光鮮亮麗,但未來可能并不樂觀。
當時我的博士導師譚鐵牛院士去北郵做了一場關于人工智能的講座,講到機器人、人臉識別、虹膜識別等內容。我聽完后覺得非常有趣。我當時覺得,即使人工智能無法實現商業化,也可以做很長時間的研究,成為一名學者也很不錯。但如果人工智能真的實現了,那將是改變世界的東西。
李善友:你在當時就有了那種“改變世界”的心態嗎?
余軼南:是的,我當時覺得人工智能要么是玄學,要么是改變世界的技術。我把它當作一種“彩票”,如果它無法實現,我可以繼續做研究;如果它實現了,那將帶來巨大的變化,對我個人來說也是巨大的機會。
你要賭一件事,這件事肯定有很大的不確定性。但如果你去做這件事,它的下限不會太低,而上限卻非常高,那這件事就值得去做。新技術的上限太高了,我幾乎沒有猶豫。
李善友:這就是你做決策的根本邏輯。
![]()
地平線前夜:10萬臺GPU催生的“算力信仰”
余軼南:我第二次真正意義上的轉變,其實是和余凱一起離開百度去創業,成為地平線創始團隊成員。
這是一次比較大的轉變,因為我們這些做互聯網和AI算法的人,開始涉足機器人和芯片領域,進入智能汽車和AI芯片的賽道。
但這個轉變背后也有一個底層邏輯。在百度的三年時間里,我們幾乎把所有能用深度學習解決的問題都嘗試了一遍,但在應用和部署過程中,我們遇到了一個巨大的問題——算力很難支撐。
百度日活躍用戶可能達到上億級別,要為這樣的用戶量提供服務,服務器規模至少需要十萬臺起步。這在當時幾乎是不可想象的。
李善友:當時你們已經意識到十萬GPU集群的難度了?
余軼南:是的,我們很快算出每個服務需要的算力。另一個問題是訓練芯片。當時我們已經意識到英偉達CUDA已經占據了主導地位,全球都在使用它。
所以余凱當時就有了一個想法——做AI推理芯片,做端側芯片。因為端側的市場需求比云端要大得多,算力當時被認為是一個非常重要的業務。
很多戰略級的判斷其實并不復雜,一開始就能看得很清楚。
李善友:所以你們意識到算力是一個關鍵瓶頸?
余軼南:是的,算力是一個非常重要的商品,需求越大越好,功耗越小越好,成本越低越好,這是一個無止境的追求,天花板極高。這是地平線的底層邏輯,對算力需求更高的場景。
![]()
避開英偉達的云端主戰場,死磕端側推理芯片
李善友:那你們做的端側AI芯片和算力之間是什么關系呢?
余軼南:端側和云端都需要越來越強大的算力。
我和余凱都有一個特點,就是不想在主戰場競爭。比如現在機器人市場的主戰場是人形機器人,但我做Vbot 維他動力沒有選擇人形機器人;當年AI芯片的主戰場是云端訓練芯片,但地平線選擇了端側芯片這個細分市場。
李善友:新興價值網。
余軼南:對,選擇一個新興市場,競爭對手少。這其實是一種創業的“品味”。
李善友:你似乎是一個“少數派”,不在主戰場競爭,決策迅速。那么,地平線在端側選擇了多個場景,你為什么堅持做智能駕駛?而且最終只有智能駕駛真正做出來了。
余軼南:其實這件事并不是我堅持的結果。一開始,我們幾乎是什么都做,但當時的一些摸索,效果都不理想。
這時我有一個洞察:如果某個業務對AI算力的需求是有限的,那它可能就不是我們想要的方向。因為公司的戰略本質上是賭社會對算力的需求會越來越大。但如果某個業務的算力需求本身就有天花板,而且很低,那我們做到一定程度就會停滯,甚至開始卷入其他競爭。
相比之下,智能駕駛是個很好的方向。大家至今都不知道算力需求的天花板在哪里,下一代芯片要達到1000TOPS,甚至2000TOPS,但沒人敢拍胸脯說2000TOPS就能實現L4級自動駕駛。也許需要10000TOPS?所以你看,這是一個沒有天花板的領域。如果大家認為L4或L5是自動駕駛的終極目標,那實現這個目標需要多少算力?至今無人知曉。
李善友:這是一種第一性原理的思考。
余軼南:是的,底層邏輯決定了你應該在算力這件事上全力沖刺,而不是等待應用的出現。你要先跑到前面,等待應用的出現。
李善友:你要跑到前面,讓應用來找你。
余軼南:對。這就是地平線的邏輯。為什么我們當時做安防,最終沒有做下去?因為安防對算力的需求其實很低,一兩個TOPS就夠了。這種情況下,你和其他公司的競爭就會變成其他方面,比如成本控制。因為一兩個TOPS的AI芯片太容易實現,所以這個市場機會并不屬于我們。
但如果你選擇卷高算力,那他們未必能卷過你。不過當時高算力市場還很小。所以你會發現,機會往往來自于那些別人覺得戰略正確但又看不上的領域。他們看不上的原因可能是因為市場太小,但你先投入了,所以才有機會贏。
我覺得創業的魅力就在于,你是否比別人更早看到一些東西。
李善友:我完全理解。只有這樣才能戰勝巨頭。因為這個需求本身和供給會形成一個越來越強的正循環。
![]()
真偽AI公司的試金石:Scaling Law
余軼南:我覺得如果你做AI,一定要找到一個場景,讓用戶對算力的需求大,這樣他們越愿意買單。如果你的產品沒有對無限算力的需求,那它就不是真正的AI產品,只是一個自動化產品。
李善友:換句話說,如果不是算力和性能之間存在某種“增長規律”,那你的產品就不算AI產品。
余軼南:沒錯,這幾件事是相互關聯的。核心問題是,這是一種非線性的東西,它本質上是一種Scaling Law(尺度定律)。在AI領域中,目前主要由算力和數據支撐。如果你的場景對AI算力沒有無窮盡的需求,那你就無法形成這種增長規律。
余軼南:現在資本市場對公司的劃分主要有兩種:一種是有Scaling Law的業務。你的資金是線性增長的,但性能是指數級增長的。比如,同樣多花10塊錢,你能實現比別人高出5倍的性能。
另一種,如果你的業務是做一個10TOPS算力的產品,然后通過各種優化讓產品表現很好,大家會覺得你是一個科技公司。
科技公司和AI公司的區別在于,你是否真正追求和需要Scaling Law。
![]()
創業的發心,為什么要做機器人?
李善友:我們再回到一個問題上,你當初為什么要從地平線出來創業做機器人領域?
余軼南:是我自身的職業追求——我想親手操盤機器人領域的事業。
當時有兩條路徑可選:一是留在地平線推進機器人業務,二是出來自主創業。留在地平線的路徑清晰且穩妥,沿用智駕業務的成功模式即可:先深耕算法研發,再推出整體解決方案,最后與中型機器人企業建立合作,就像我們當年與長安、理想合作推進智駕業務那樣。但繼續留在舒適區做To B業務,對我而言已經失去了原本的吸引力。
選擇出來創業,確實意味著要直面指數級增長的風險,資金鏈、產品力、市場反饋,任何一環的失控都可能讓公司瞬間崩盤。但我的想法是: 做To B業務很大的痛苦在于“等待”——你要等客戶覺醒、等生態成熟。而自己下場,我就不需要再“等別人”,我能以最快的速度直面市場,親自把產品閉環的節奏拉到極致。
![]()
C端市場,為什么首批種子用戶比技術壁壘更重要?
李善友:項目正式啟動了,相當于“孩子”順利誕生了。這次銷售情況怎么樣?
余軼南:銷售情況相當不錯。這次所有用戶都是付費購買的。要知道,在中國愿意花10000塊錢買一臺四足機器人的人,底色都非常出色,基本都是核心科技愛好者。
李善友:這就是種子用戶群體。
余軼南:對。觸達這群用戶后,可以靈活拓展不同產品。這群用戶才是最關鍵的不變量,遠比技術層面的不變量更重要。真正決定長期發展的,還是這群核心用戶。
教授:就像現在開新能源車的人,已經有了“我們”的群體意識,甚至會對開燃油車的人有認知差異。
余軼南:新能源汽車用戶的群體特征就很明顯。幾乎所有新能源車用戶,本質上都是特斯拉的粉絲,特斯拉先圈定了這一大波核心人群,之后蔚小理、小米等品牌才從這個群體中分化出自己的用戶。不管買哪款新能源車,大家都默認特斯拉是行業標桿,這種品牌認知太關鍵了。所以如果特斯拉推出機器人,最早買單的肯定還是這群核心用戶。
教授:對,這群人有了品牌歸屬感,你只要切入這個群體,就能依托他們發展。對做機器人行業來說,能進入這樣一個有凝聚力的群體,太寶貴了。
余軼南:用戶對品牌的認知,遠比技術、渠道這些因素更重要。
從結果來看,我覺得市場表現非常合理,甚至B端市場超出了我的預期。
B端方面,我們的客戶主要分幾類:第一類是地產商,他們旗下有眾多小區物業,希望利用我們的產品來提升物業服務,比如快遞巡檢和小區內的交互服務;第二類就是教育機構,我們聚焦下沉教育科研市場,涵蓋大學、職業學院、初高中等,使用者不需要太強的編程能力,只需把機器人本體當作訓練載體即可;第三類是各類園區、景區,這類需求和地產商的需求邏輯較為接近;第四類是線下門店,比如耐克的兒童門店,會用機器人吸引孩子、營造氛圍。
這些市場并非突然涌現,而是原本就存在。核心競爭力其實在于產品是否能實現10倍性價比的提升——不只是性能,還包括外觀、成本等綜合維度,只要綜合價值比原有產品高出10倍,B端客戶就會迅速轉向我們。
![]()
未來AI組織的形態:“太上老君”式架構
李善友:你之前提過,自動駕駛領域的人紛紛出來做機器人,這背后似乎藏著一個更重要的趨勢。為什么自動駕駛領域的從業者會集體轉向機器人賽道呢?
余軼南:我覺得原因很簡單。自動駕駛行業基本上已經進入收官階段了。能站穩腳跟的就那么幾家企業,新入局者再無機會。這是其一。
其二,即便完成了端到端技術落地,后續還要經歷五年的深耕期,整個產業的想象空間已經大幅收縮,缺乏足夠的增長預期。
同時,行業還存在組織冗余的問題,人才供給嚴重過剩。因為隨著端到端技術的成熟,原本需要“人海戰術”的研發模式已經被徹底顛覆了。
自動駕駛的組織結構可以分為端到端技術落地前后兩個階段。端到端之前,行業普遍采用“大感知、大環境模型、大規控”的架構,每個板塊下又細分出諸多子任務,再往下還有負責基礎設施、數據、仿真、實車測試的團隊。這種結構的人才密集區,就集中在這些細分任務板塊。像地平線、Momenta這樣的企業,這部分人員加起來大概有五百多人。
但當技術迭代到端到端階段后,這些細分任務被高度整合壓縮,不再需要大量人員分別訓練模型,原本負責這些工作的人就面臨轉型問題。
而機器人賽道剛好資本涌入、企業增多、崗位充足,所以他們大多轉向了這里,相當于把2015到2020年自動駕駛領域的發展路徑,在機器人賽道重新走一遍。
李善友:你之前對AI公司和科技公司的定義非常精準——核心看算力、模型與應用之間是否形成正向循環。按這個定義來看,現在什么樣的公司算是AI公司?
余軼南:AI類企業的人才結構特點,我把它比作“太上老君式組織結構”。
我們可以把AI模型研發比作《西游記》里的煉丹:
太上老君:這是公司的靈魂人物,負責定戰略、給配方。
煉丹仙童:這是核心層。他們思維極度敏捷,守著丹爐、把控火候(訓練模型)。一家公司有10個這樣頂尖的“仙童”就足夠了。
修爐采藥:這是基建層。負責“修爐造爐”,就像提升“三味真火”的效能一樣(搭建基礎設施,提升算力效能)和“尋藥采藥”(清洗處理數據)。
首先,大模型公司肯定屬于AI公司,它們對算力有持續需求,且形成了算力、模型與應用的循環。
而機器人公司中,大部分還是采用傳統組織結構,本質上屬于科技公司,真正采用“太上老君式組織結構”、符合AI公司定義的極少,核心原因是機器人的本體技術尚未定型。
AI公司的成立有個前提:硬件和基礎設施必須先收斂。大模型公司能成為AI公司,就是因為它們無需操心計算、網絡和用戶觸達問題,用戶通過手機APP或網頁就能便捷使用,觸達門檻極低。
但機器人行業和汽車行業類似,必須先把本體(硬件)做好,才有后續AI技術的落地基礎;如果本體都沒打磨成熟,AI技術再先進也無從施展。所以機器人行業必然要經歷兩個階段,目前大部分企業都還處在“先做好本體”的階段。
李善友:那你規劃的路徑是什么?
余軼南:我們肯定是先做好本體,再推進AI技術落地。AI相關的工作可以后續持續深化,但本體必須優先打磨到位,這是基礎中的基礎。
李善友:你的每一段經歷似乎都在為當下的事業鋪路,而且每一次轉型都實現了跨越式提升。
余軼南:確實是這樣。其實從我讀研究生開始,所做的一切本質上都是在為做機器人積累,相當于一直在圍繞這個目標鋪墊。
李善友:沒錯,但這件事早做也不行,時機很關鍵。必須先有大模型AI、自動駕駛AI的技術積淀,才能支撐起機器人的落地。如今來看,機器人其實是物理AI的第一大應用場景——自動駕駛目前還未完全達到這個層面,未來或許有機會,但機器人的優勢在于算力基礎足夠扎實。
真正能讓你與競爭對手拉開差距的,正是你之前提到的這一點:讓模型與算力相互賦能,形成越迭代越智能的正向循環。
余軼南:對,就是這個道理。
李善友:一方面抓住技術端的正向循環,另一方面抓住用戶群體,激發他們的群體心智——這群人已經形成了強烈的群體認同感和“我們”的歸屬感,與他們共同成長。核心就是這兩大板塊:技術端和市場端,把這兩點做好,前景就非常廣闊。那你接下來的精力是不是應該多放在第二代產品上?
余軼南:現階段我想把更多精力放在第一代產品上。這一點,我借鑒了地平線的成功經驗——地平線的第一款產品征程2,我們花了很長時間深耕,把它鋪到了各個場景,通過這個過程建立起了廣泛的用戶群體和合作關系,后續產品再推向市場時,就很容易切入。
李善友:后續產品也能快速跟上。
余軼南:創業就像打江山,先圈定用戶地盤更重要。用戶是有限資源,一旦用戶選擇了我們的產品,就大概率不會再選擇競爭對手。所以現階段的核心,還是先把用戶側跑通,把用戶端的增長速度和市場勢能做起來。
打開小宇宙 app訂閱混沌創辦人李善友的播客節目,每兩周的周四準時上新,我們期待與你相見!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.