![]()
中國、硅谷、模型、具身、AI硬件和AI Agent,這些標簽共同組成了今年創投圈最熾熱的氛圍,而這些看似獨立的標簽之間更有著關系整個AI創業生態的聯動密碼。當身上貼有這些標簽的頭部創業者們匯聚一堂,在阿爾法公社創始合伙人許四清的引導主持下各抒己見,我們得以透視2025全球的華人AI創投圈到底發生了哪些令人興奮的變化。
嘉賓簡介
諾亦騰機器人創始人兼CEO 戴若犁
戴若犁是諾亦騰機器人創始人/首席執行官,畢業于中國科學技術大學(9705)與香港中文大學,獲機械與自動化工程博士學位。戴博士在動作捕捉、人機交互以及機器人遙操作、具身智能數據平臺構建等領域擁有超過15年的前沿創新經驗。在創立諾亦騰機器人之前,他聯合創辦了諾亦騰科技(Noitom Ltd.),作為公司技術與產品的第一負責人,成功交付數萬套動作捕捉系統,服務全球50多個國家用戶,幫助公司取得約70%的全球專業動作捕捉市場份額,確立行業領導地位。截至發稿諾亦騰機器人官宣完成數億元人民幣的Pre-A+輪融資,本輪融資由啟明創投領投,五源資本、君聯資本等機構參與投資。
無界動力創始人兼CEO 張玉峰
張玉峰是無界動力的創始人兼CEO,曾任地平線副總裁、智能汽車事業部總裁、公司董事及經營管理委員會成員,于2025年創立無界動力,該公司專注于構建機器人“通用大腦”與“操作智能”,突破“手、眼、腦”協同的關鍵瓶頸,讓具身智能成為可廣泛部署、持續進化的基礎設施。公司首代機器人平臺已在工業制造與商業服務兩大方向取得實質性突破。無界動力首輪3億元天使融資,由紅杉中國、線性資本領投,高瓴創投、地平線、華業天成、鐘鼎資本、BV百度風投、同歌創投等跟投。據悉,天使+輪融資已接近完成,累計融資額超5億元。
Looki創始人兼CEO 孫洋
孫洋是Looki的創始人兼CEO,畢業于卡耐基梅隆大學計算機專業,曾任職于Google,Amazon,Momenta和美團。Looki創立于2024年,旨在通過打造AI的“眼睛”與“耳朵”,將AI無窮潛力融入并賦能于每個人的日常生活。Looki首款產品L1自今年8月在海外上市以來,已取得了卓越的銷售業績與用戶口碑;Looki L1已于12月16日正式登陸國內市場。目前,公司已完成天使、天使+和Pre-A三輪共計超千萬美元的融資。投資機構包括BAI資本、鐘鼎資本、阿爾法公社和同歌創投。
元理智能創始人兼CEO 張帆
張帆是元理智能的創始人兼CEO,畢業于法國巴黎十一大,主修人工智能。2022年創立元因智能,被智譜AI并購,2023年加入智譜AI擔任COO,2025年6月離職智譜AI,創立元理智能,聚焦商業強化學習,致力于將模型能力轉化為數字化勞動力,為企業提供可量化的生產力解決方案。元理智能已于近日完成近千萬美元種子輪融資,由藍馳創投領投,光源創業者基金跟投。
Aha創始人兼CEO Kay Feng
Kay Feng是Aha的創始人兼CEO,深耕達人營銷與AI和SaaS行業7年,以對行業結構的深刻理解,打造出全球首個“AI員工式”達人營銷平臺Aha。目前已服務300多家客戶,覆蓋AI領域的全球領先企業與高速成長的創業公司。18歲時,Kay輟學加入Dora AI創始團隊,作為市場負責人,推動產品從0成長至50萬用戶,成為23年增長最快的AI產品之一。Aha已獲得錦秋基金、金沙江創投的投資、聯想創投和初心資本等多家知名機構的總計千萬美金級別投資。
阿爾法公社創始合伙人、CEO 許四清
許四清,阿爾法公社創始合伙人、CEO,畢業于中國科學技術大學和中國科學院,分別獲得學士和碩士學位。他曾三次創業,2010年作為COO成功帶領創業公司在美國納斯達克上市。許四清曾擔任創新工場投資合伙人、奇虎360首席營銷官,后加入中經合任董事總經理負責中國的投資和管理工作,2015年創立天使投資機構阿爾法公社。許四清擁有20年以上IT、互聯網及通訊行業的工作經驗, 曾開創微軟公司華南區業務并就任第一任總經理,擔任中國網絡通信有限公司數據業務總經理、藝龍旅行網首席市場營銷官等職務。許四清共5次獲得“福布斯中國最佳創投人top100”稱號。
中美創業與資本環境的體感問題一:2025年您所在的賽道,中美創業環境有什么不一樣?華人團隊有什么獨特的優勢?
戴若犁:過去我們服務的更多是影視和體育行業的時候,還是會發現在理念的先進性,或者是說客戶的發展階段方面,美國的領先性還挺明確的,而且基本上都是海外的業務要大于國內的業務。而我們目前的感受和以前完全不一樣,至少在機器人這行業里,中美是沒有代差。
雖然大背景是沒有代差,但實際這個生意做起來還是有挺大區別的。我們做的業務是典型的TO B的業務,TO B業務的本質其實是甲乙雙方的勞動力成本置換,或者說是能力的置換。在不同市場環境下,TO B業務的推進邏輯會有明顯差異,這與當地的勞動力成本結構、客戶組織方式以及技術分工習慣都有關系。相對來說,美國的業務會更好做一些。
在中國市場,企業全棧/全鏈路自研是一種思維定勢,更希望TO B合作企業提供概念驗證。但美國的客戶或者說全球其他勞動力成本相對較高地區的客戶,他們對于垂直整合這件事情的追求就沒有這么強勢,或者沒有那么執著,客戶更傾向于基于清晰分工和長期合作關系來推進項目。
所以對我們來說,中國的生意體量大,中國的客戶離我們更近,但是海外的客戶可能毛利更高,也更容易沉淀長期合作項目,所以市場體感上還是有挺大的區別的。
純粹說機器人行業,中國市場參與的主體的更多,投資階段分布更廣,覆蓋了更多相當早期的企業。而美國市場的資本集中度相對更高,馬太效應更強。
張玉峰:第一點,我覺得首先從團隊來講,中國的團隊是更兼備聰明和勤奮的。我舉一個我最熟悉的新能源汽車和自動駕駛行業的例子,三年疫情期間,海外的很多企業團隊都處于停擺狀態,甚至直到今天,歐洲的一些團隊還在居家辦公。但這三年期間,最起碼在我所熟悉的新能源汽車和智能駕駛行業,實現了非常快速的追趕和超越。比如我們用八個月時間,幫助一家新勢力車企把ADAS自研從立項到量產上車,到頭一年就達到十萬量級這樣一個速度,是非常能說明問題的。
然后第二點,我覺得國內目前的市場和行業的格局,對于打磨產品是一個非常好的機會。國內的B端客戶和消費者對于新產品新技術的容忍度和接納程度都非常好,同時B端客戶對于一個新產品導入的要求和期待又非常高。他們可以給資源,給支持,同時也給很大的壓力。這種卷法帶來的結果,就是我們可以通過與B端客戶深入的聯合共創,來快速產出有競爭力的產品,再去批量化地復制,包括走向海外。
孫洋:在AI硬件賽道,中國在硬件的產業鏈上肯定是有優勢的。其實大家更多的探索是AI硬件會以一個什么樣的方式去切入大家的日常生活,給用戶帶來更大價值。這是一個相對早期,相對模糊的方向,對于創業團隊來說更需要保持的敏捷,是頭腦敏捷和實驗的敏捷,更多在于想象力和taste方面的探索。
說回中國團隊的優勢,我覺得軟硬之間的結合這件事情,是中國團隊毫無疑問的得天獨厚優勢。美國的軟件非常強,AI非常強,但硬件上明顯的一個短板。我們也看到很多美國的同行做的AI硬件產品,最后并沒有收到市場的正反饋。他們大多數只是兜售了一個比較強的AI概念,但交貨有可能一年了也無法交貨。
Kay Feng:我們自己本身服務了很多中國科技公司的出海,以及很多歐美本土市場的科技公司。這兩類創業公司的市場邏輯有一些明顯的不同。歐美的客戶在軟件領域,或者說TO B領域的垂直專業性和服務深度非常高,公司數量多,資本關注度也高。在每一個細分場景其實都有做的很深的公司,他們的切入口都非常小,但深度做的很深,市場的策略也很垂直。另一方面我們能看到中國出海的創業者們,大部分還是偏向TO C,他們更希望以一個整體的角度去做增長。當然,這得益于中國過去互聯網時代積累下了一批流量玩法和增長人才,他更習慣和擅長從這個角度去考慮公司的市場。而歐美TO B公司的增長邏輯和方法論,也同樣得益于上一代SaaS類產品的經驗和基礎。
而最新的變化是,今天新的這一波中國出海科技公司,他們的決策行為已經越來越接近于歐美本土的客戶了。
張帆:很多投資人問我的第一個問題都是中國TO B到底能不能干?我覺得,不是中國的TO B不好干,是中國的軟件不好干。咱們看那些國內互聯網廣告平臺,大家都在心甘情愿的在付費嘛。我覺得中國軟件企業不好干,是由于中國的企業的數字化還沒有那么成熟,以至于他無法判斷一個單點在整個鏈路里的貢獻,所以只能是通過整個鏈條的結果來判斷價值。而AI是一個非常好的切入點。在AI出現以前,我們賣軟件其實都是一個不顯性的價值呈現。但今天AI讓我們有機會把軟件的顯性價值做出來。比如我們今天真的能將AI轉化為一個數字員工,那它到底能給企業帶來多少價值,是完全顯性的。這也是為什么我們一直認為AI在TOB上并不是對標軟件市場,而是對標勞動力市場。
第二個點來講,我覺得中國的優勢在于大家對于新技術的擁抱,比絕大多數海外國家要更快的。像歐洲很多人還在還用諾基亞的功能機。過去我們服務過很多全球性企業,我們會發現即使我們的基座模型并沒有美國那么好,但是我們在這些跨國項目上所產生的結果,都會作為客戶全球合作的標桿。中國對于新技術的擁抱和開放,是在刻骨子里的。
在大模型的方向上,中美其實還是蠻一致的。在國內,無論是智譜,字節,阿里、kimi等等,基礎模型都做的很好,可能只用了海外模型的十分之一甚至更少的算力,就得到了今天這樣的結果,普及率也非常高。可能唯一的區別在于,今天中國企業對于模型應用的轉化率是比海外團隊快得多的,所以我們從應用反饋回來的認知也會更多。
問題二:2025年公司或者AI圈最讓您興奮的事情是什么?
張帆:讓我最興奮的事,其實是強化學習的跑通。其實強化學習本身并不是個新技術,但是在去年Q4,幾乎所有的人都在討論一個話題,就是人類數據不夠用了。甚至連illiya也在公開發言說人類的語料是化石燃料,用完就沒了。但你會發現,今年已經沒人聊這個話題了,根本的原因其實是在于強化學習的跑通。特別是應用在今天大量的數學,大量的coding,GUI已經得到了非常強的驗證。
之前的情況是,人標的東西你才可以學,如果人標不了,你就學不了。所以嚴格意義上,機器永遠超不過人。但是強化學習的出現,讓我們開始從alphago走向alphago zero,讓我們突破了人類的認知邊界。這件事兒帶來了一個極大的變量,我認為也由此開啟了AI的下半場。
Kay Feng:2025 年行業中讓我最興奮的一件事是:Agentic AI第一次在真實業務里跑通了。之所以說這是今年,不是因為agent這個概念新,而是因為支撐它跑在真實業務里的關鍵技術條件,直到 2025 年才同時具備。第一是長期任務和上下文記憶真正跑通了;第二是工具調用和執行穩定性發生了質變;第三是從人類示范,轉向結果驅動的自我優化。 回到公司來看,作為 Agentic 的TO B產品,今年我們從業務數據上真的能看到Aha作為一個平臺的飛輪效應被點燃,我們達人側的入駐速度,呈現了一個指數級的增長,半年內就從0上漲到5萬。然后另一方面,就是全球那些最頂尖的AI客戶和頭部大廠都能選擇我們這樣一家成立才半年的公司。
孫洋:我覺得最興奮的兩個點就是Google的回歸和Gemini 3的出現,其實這兩個也是一回事啊。我覺得Google的回歸是讓整個25年的模型賽道撥亂反正。大家之前會看到Open AI已經開始做一些硬件,但其實我覺得模型還遠遠沒到天花板,Google的回歸也讓大家重新聚焦回模型能力的進一步提升。而Gemini 3的出現也符合我們的預期,在多模態能力又前進了一大步。去年大家所看到是,都是假的多模態,今年Gemini 2開始大家又在做圖片幀的動態,然后直到Gemini 3的出現,視頻的能力又進一步增強,這是符合我們對模型發展趨勢的預判的。
張玉峰:技術的發展層面上,其實讓我最興奮的今年能看到視頻生成大模型,真的能將越來越多的物理規律展現,內嵌到其生成的視頻中了。這不僅是對Scaling Law的進一步佐證,同時也對未來具身行業的數據補充,給予了我們很大的信心。
從我們無界動力來說,最令我興奮的,還是成立不到半年時間,我們就成功的讓一群背景各異的超級個體們快速融合成了一支執行效率極高的團隊,也基本上完成了每個環節的從零到一。
戴若犁:2025年,我女兒考上了一個她特別喜歡的學校,這個肯定是第一啊。然后我們講回科技圈。過去來跟我們聊數據業務的業內同仁一般都在聊幾千小時,頂多上萬小時的數據。但是就最近美國有一家公司叫Generalist,這家公司大力出奇跡,自己獨立驗證了一把Scaling Law,他們用了27萬小時的數據做了訓練,并且在這27萬小時之內沒有看到任何訓練收益的放緩。這件事情之后,來找我們聊的業內同仁們的數據單位也都變成了以十萬小時為單位。這也讓具身這個行業整體認識到Scaling Law的邊界其實還很遠很遠,這件事還是挺讓人興奮的。
問題三:您覺得中美的科技資本環境有何差異?
戴若犁:美國的早期階段融資中,如果是用SAFE(Simple agreement for equity)這樣的方式融錢,機制相當簡化,這是很偉大的。他們也更愿意在小圈子里邊閉環,整個融資的事情就在一個微信群或者group里就能完成,更強調對創新和試錯的支持,對于創始人的壓力相對比較小。
張玉峰:我感覺關于堅信一個技術或堅信一個方向長期投入,也就是資本的耐心方面,美國整體上還是一個更加包容的狀態,這一點確實值得我們繼續學習,但也并不是一個特別大的問題。
孫洋:我覺得其實在硅谷,在美國的VC圈,投資一些高風險的項目來獲得高回報這件事上,大家收到過很多的正反饋。而在國內,大家可能更愿意投一些共識類的項目。但我覺得在今天中美在AI這個賽道上,基本上一個同樣的起跑線。希望中國的VC能夠更大膽地去支持創業者去做一些非共識的事情啊,和冒風險的事情。
張帆:今天國內的資本市場過度相信共識,我覺得無論是創業還是技術,其實只有反共識才能帶來競爭力。我們都在追求做更大的芯片,更大的集群,更多的token,token的單價更低,然后我們要做C端,我們要1~2人的公司,快速能拿個100萬美金的ARR坦率講,我覺得這些其實都是偏向于線性思維。
許四清:中國在早期投資領域還有很多值得向硅谷學習和借鑒,從投資行為來看,硅谷的風險投資中,有接近一半集中在早期投資;中國的這個比例是他們的1/5-1/7,從這個角度看,我們還需要加強。
深度對話:具身、模型、硬件與AgentTo 戴若犁
許四清:諾亦騰本來占了動捕差不多全球七成的市場份額,你為什么把這個諾亦騰機器人拆出來單獨做呢?這個想法的出發點是什么?
戴若犁:傳統的動作捕捉技術服務的都是一些小而美的行業,像影視特效,人機交互,重度科研,體育運動,醫療健康,它的天花板并沒有那么高,但是很剛需,整個行業的迭代也不會太快。而機器人這個行業的進步是非常快的,這個行業的成長速度,已經是指數級的速度。
所以我們會需要用不同的團隊,不同的思路,不同的企業的經營方式,也需要用不同的估值和募資的體量去支持這件足夠大的事情。當這件事足夠大的時候,其實是特別值得最好的團隊一起進來的,所以就決定成立一家新公司。
許四清:大量的機器人公司在自己做動作捕捉,為什么需要你?
戴若犁:核心其實還是專業化分工和成本問題。就像臺積電和富士康存在的核心的原因其實是有大量的成本攤銷。對于絕大部分的機器人公司來說,數據的Infra的團隊本身不是核心,但卻是一個長期、高投入、高經驗要求的團隊,因此規模體量可能也較小,往往很難在資源、規模和經驗積累方面形成效率優勢。
而我們可以在多個客戶和項目之間去攤銷長期的研發成本,我們專精這件事情的同事持續積累在數據采集、處理與交付上的經驗。所以從各個層面上面來說,諾亦騰機器人(Noitom Robotics)作為一個三方的數據服務商,還是有穩定的市場空間的。我們的核心的理念是:做核心用戶的非核心任務的核心供應商,這可以說是我們做TO B的精髓。
許四清:展望機器人行業未來十年,你最期待出現怎樣的顛覆性的進步和變革?
戴若犁:我現在最希望看到的,就是人形機器人的通用性能夠在商業領域被驗證。
目前其實不管是英偉達還是特斯拉,他們對于人形機器人的執著其實是都是建立在底層假設第一性的基礎上。但事實上,迄今為止商業領域中不同場景的經濟性和適用性仍在探索階段。一邊是專機,也就是專門設計的特型機器人,另一邊是真人,這個中間的夾縫,是否真的可以通過人形機器人找到穩定可持續的應用空間,我認為仍然需要時間來檢驗。
如果在未來五到十年內,能夠看到人形機器人在部分商業場景中形成清晰的價值閉環,我會認為這是對整個行業非常重要的一步。
許四清:再繼續追問一下,您認為機器人的商業化驗證最有可能先發生在商業領域還是工業領域?
戴若犁:我認為應該是在家庭領域。我個人一直不認為工業生產制造當中的那個夾縫足夠寬,能夠讓人形機器人找到落地的價值。因為在工業領域里,特別確定性的任務就會走向專機,而特別泛化而困難的柔性的任務就會走向人類,所以中間的夾縫會非常的小。反而是在家庭場景里,雖然實現困難,但是還是會有很多機會。特別是一些在家庭里所謂時空分離的機會,比如掃地機器人這種場景。時空分離下對于容錯性,安全性,隱私性等各方面的容忍程度都會高一些,又不像在工業領域里非常容易被自動化流水線專機和便宜的人類勞動力去替代,所以這個夾縫會稍微寬一點點。
許四清:最后一個問題,針對剛才提到的27萬小時的訓練數據,在你看來真實數據和仿真數據之間是一種什么關系呢?
戴若犁:來自于真實世界的真實數據和合成仿真數據,這兩條路徑肯定是一個協作狀態。
我們從最底層來說,機器人需要從數據中學習的東西可以粗暴地分為兩類,一類叫做規則rules,另外一類叫做先驗叫prior。這兩類東西里,規則是可以枚舉和合成的,但人類先驗是無法枚舉和合成的。從這個底層邏輯來說,很難說真實數據或者仿真數據單一能解決所有問題,大概率這兩者其實是需要合作的。
To 張玉峰
許四清:無界動力提出的通用基礎模型和通用專家模型雙線驅動,那你們是如何構筑你們在這兩個場景里的核心競爭力呢?
張玉峰:先回應一下剛才戴總和許總聊的這個話題。我覺得首先,面向具身的基礎模型或者基座模型,最終還是要在真實場景中去得到鍛煉迭代。只在仿真或者在實驗室去做,永遠難以接近真實場景所需的泛化能力和精準度,也很難普及開來。我們必須要通過實際的部署來實現規模化,其實無論是對于大語言模型還是具身來講,規模化還是一個非常重要的話題。
其次,從路徑上來看,其實我們可以快速回顧一下智能駕駛。過去十年的時間里,有像Waymo這樣的企業,希望一下就能把復雜的事情做到無人化;也有像Tesla這樣的企業,走漸進式路線,從一開始僅能做到車道線保持,然后學會了變道、并線、上下匝道再到城區駕駛,整個過程中都在不斷地采集數據。我們會認為,漸進式的路線其實是我們具身智能公司能夠去形成突破并構建護城河非常關鍵性的選擇。其實人工采集的訓練數據量即使達到27萬小時,相比我們整個人類的語料數據量還是差很多。將來為了更大數量級的數據采集,要付出的代價會越來越高。它的成本性、可持續性到底如何,我還是抱有一個問號。
不同于大語言模型或者自然語言處理那個時期,存在著很多既有的專家模型。大模型的出現,就基本上把專家模型全都并掉了,實現了快速的“由專到通”。但這件事的前提是有可獲取的、海量的數據,所以比較容易通過新的算法范式去訓練大模型兼并掉各種專用小模型。但是具身智能現在面臨的挑戰是優質的、尤其是真實場景的真機數據非常稀缺,所以很難一蹴而就,我們還是要堅定地走漸進式的發展路線。
再說到場景選擇,其實從場景到任務,本身有兩個維度,一個是場景的復雜度和多樣性,一個是任務和包括被操作物體的復雜度和多樣性。家庭場景屬于四象限里最靠這個右上角選擇,也就是場景本身和任務對象都更復雜的區域。確實有很多企業在深耕這個場景,但更多的企業,包括Tesla、Figure等,雖然嘴上講著要進家庭場景,但身體還是很老實地撲在了B端場景,包括工業,商業服務等。這些場景都能夠讓我們在目前技術不成熟、數據量缺少的情況下,通過做一定的減法,就能夠較快的實現落地閉環的。
說到我們自己為什么有雙線驅動策略,其實是要用好這個通用基座模型的通識能力來支持我們的垂類專家模型,使得其能夠在半結構化的工業制造或者商業服務場景去產生價值,再進一步去激活整個數據閉環,實現商業支撐,在這個長坡厚雪的賽道上打一場更持久的仗。
我們的信心來自于我們在過往自動駕駛行業中,研發交付超1000萬套的智能駕駛軟硬件產品。然后我們希望通過這種持續的漸進式的路徑,結合技術場景,利用好生態,把我們具身智能的護城河持續的拓寬。
許四清:你認為具身智能的突破是否就依賴世界模型的突破?還是有什么其他路徑?
張玉峰:世界模型這兩年確實非常火,然后也衍生出很多不同的子概念,也容易讓人混淆。大的類別上肯定有顯式的仿真模擬真實世界的生成式世界模型,比如李飛飛老師正在做的事情或者可交互的視頻生成類大模型,同時也有內嵌在模型算法里隱性的,為決策提供物理規律先驗的隱式世界模型。
先說結論,我認為世界模型是具身智能走向通用的一個非常強大的必要條件。從生物的智能進化路徑上看,自從哺乳動物進化出新皮質,就擁有了對自身運動和內部狀態,以及對外部世界的預測想象能力,這實際上就是世界模型。這個世界模型和像Sora這樣像素級別構建虛擬空間的顯式世界模型不太一樣,它不需要耗費那么大的資源來做像素級還原,但是卻能基于對物理規律的認知,讓包括我們在內的哺乳動物擁有預測、想象、揣測、模擬這個世界可能的變化并更好地在現實世界完成動作的能力。
所以具身智能如果要走向更像人一樣去思考,去模擬,去預測。從終局來講,其實需要一個類似于人和高等動物一樣內置的隱式世界模型。不僅讓機器人知道要做什么動作,還要理解為什么做這個動作,而且能夠去模擬想象做這個動作之后會發生什么事情。
我們無界動力當前更多的是在隱式世界模型方向上做研發,把它內嵌在負責動作執行的VLA模型里。同時顯式世界模型也是有意義的,對于目前數據短缺情況下(基于真實數據增廣)提供高質量的數據補充也非常有幫助。現在自動駕駛行業也用這種世界模型來做一些corner case 數據的增廣和生成,sim2real gap相比以前小了非常多。在隱式和顯式當中,我們更側重于投入在隱式的世界模型上,同時在顯式的世界模型上也會有相應的一定量的投入。
To 孫洋
許四清:Looki的第一代產品是以記錄生活作為切入點的,現在產品也非常受歡迎,那這一代產品對Looki而言,是探索人機交互的一個起點呢?還是會繼續把單一產品做到極致?
孫洋:應該說是一個起點吧。我們的核心就是在給AI做眼睛和耳朵,然后讓AI在物理世界里生活。大家可以把具身理解為,它有像人一樣的大腦,然后再加上四肢,能做一些事情。其實Looki在做的事情,就是先把四肢去掉,看能不能先把第二大腦的功能實現
對于第二大腦而言,Looki只是一種形態,未來也可能還會有其他的形態。這其實是隨著整個硬件供應鏈和產業鏈的發展而改變的,怎么做到低功耗,怎么能做到無感化,怎么能融入大家的穿搭里去,形態上未來一定還會有各種各樣的這種延展。
從功能上來講,其實也會隨著模型能力的增強,包括我們自己搭的記憶infra系統的升級,不斷地生長共進。我們最終還是希望搭建一個叫human-centered AI,也就是以人為中心的AI。這件事情的價值在于,今天人類所有和AI的交互還是要鎖在對話框里邊,對于普通用戶來說,每天生活里面發生的所有事情,我都要轉換成語言,轉換成prompt,然后才能給到AI的對話框。那我們換一個思路,為什么不能把AI從對話框里拿出來,讓AI自主能看到和聽到物理世界里發生的事情,這個過程將不再需要用戶再去做一個prompt轉換。
我們有一個口號叫做:這個世界就是AI的prompt。這是我們的核心理念,這是一步一步去延展的。我們先把大腦做好,可能最后再把四肢做好,未必說Looki在五年十年后不去做這件事情。通過一個消費電子產品讓大家先用起來,數據飛輪能夠轉起來,我覺得把啟動器找到這件事兒是最重要的。
下一代產品我們會做proactive AI或者叫real time proactive AI:更適時的主動式的AI。今天我們L 1的產品是需要三段式的,先記錄,然后上傳AI分析,最后給你反饋記憶。到第二代產品L2的時候,適時發生的所有事情AI都能夠快速給予反饋。L3會是更遠期的設想,我們覺得五年之后,模型的能力會讓今天所有的互聯網服務都變成Agent,但整個的Agent網絡里面會出現一個新的角色,這個新的角色就是一個中心的General Agent。這個agent它本身不能實現任何的服務,但是它是非常懂用戶。當用戶給他下達一個簡單的指令,General Agent會把這條指令延展成非常豐富的context,然后去對接其他服務型Agent。
許四清:你認為中國的硬件產品在走向全球化的時候,最大的挑戰是什么?
孫洋:我覺得對于AI硬件來說,今天最大的挑戰還是在于data compliance數據合規。因為今天的AI硬件更多都是一個數據的入口,這件事情讓數據的合規性變得非常重要。比如說最基本的,你要把數據留在當地;第二,你要做該做的數據審計;然后第三,基于不同的國家,還要對數據所有權有一些規定。而這些對于之前的消費類硬件來說,并沒有相關的積累。
To Kay Feng
許四清:Aha快速地構筑了非常好的AI科技達人的網絡,你們是如何實現這個快速增長的?
Kay Feng:其實第一個點是這個市場本身的需求就非常強烈。我們服務客戶的時候,本質上客戶花的是他的營銷預算,我們看到營銷預算里的一個最大的變化是過去大家可能把錢更多地花在廣告上,但現在其實更多的預算在往達人營銷遷移。新一代的很多科技產品、AI產品,其實一半以上的預算都投放在了達人營銷上,而不是傳統的投流廣告上。所以這里面就產生了每年上百萬美金的達人投放預算,但是這個投放過程在過去是非常低效的,這也成為客戶本身一個非常亟待解決的問題。所以你只要能做到一個比過去的agency更高效,規模更大,然后體驗更好的產品,那客戶就一定會來嘗試。
另一個角度上,在平臺開始有客戶之后,就會開始有新的達人上來接單,而它是一個自動化的流程。所以那就意味著其實客戶越多,達人就會越多,達人接過一單之后,對平臺有信任,那客戶那一側的體驗顯然就會更好,那就會有更多客戶進來。這其實就構建起來了一個飛輪,他們相互之間不斷地撬動,所以這也是一個雙邊網絡的獨有優勢。
許四清:你們在美國遇到類似的競品多嗎?
Kay Feng:其實從我們目前的情況來看,真正意義上的競爭對手更多還是傳統的人工模式競爭。這是因為我們現在主要服務的是中型及以上規模的客戶,在過去,這類客戶在達人營銷上的主流解決方案,基本只有兩種:
一種是外包給 agency,另一種是少數公司選擇自己搭建一個比較大的內部團隊。
從行業背景來看,達人營銷本身和傳統廣告有比較大的差異。
很多 agency 的核心能力,其實來自創意廣告,或者是上一代以Google、Facebook投流為核心的代理體系,它們在投放和創意上都非常成熟,但并不完全是為達人營銷這種高協作、高執行密度的工作形態而設計的。
而達人營銷這個領域,長期以來并沒有形成特別強勢、規模化的Agency形態,一個很現實的原因是:它本身就是一件高度依賴人力執行的事情。
在創意廣告里,一個成熟的人可以管理非常大的預算體量,一個人就可以承接100萬美金的預算;但在達人營銷里,預算規模一旦上來,對應的執行人力幾乎是線性增長的,要做100萬美金的達人營銷,可能就需要100個人來做。
所以其實今天在歐美,客戶反而會更迫切地尋找能降低對人工規模依賴的解決方案,因為如果想規模化,他的人力成本是真實存在的。
To 張帆
許四清:你原來做通用大模型,現在你要做商業的強化學習,是否可以與大家分享一下你對模型的看法和心得嗎?
張帆:首先我覺得一個有意思的點就是在于,我覺得商業強化學習跟基座模型,它不是一個賽道,它是一個延展關系。市場上一直有一個兩種邏輯的爭論,一種邏輯說將來會有一個超級大一統的模型解決everything;另外一種邏輯說將來市場上會出現無數的垂類模型,來解決不同的事情。這兩種到底哪種會是未來。
我們先看看人類是怎么做的,我們會發現人類從5000年前到今天,其實人的腦容量沒有明顯的變化,但是今天的人類比5000年前的人單人的生產力大了1000倍。你可以發現,進化論并沒有把我們每個人進化成一個200斤的腦袋,而是讓我們維持原有的腦袋的size,但是我們解決問題的能力依然可以遠超原古時代的人類。這個核心的原因和變化就叫做分工,分工之后就是協作。
分工的邏輯是在于讓每個模型獨立訓練,協作的邏輯是在于讓所有獨立訓練的模型解決統一的目標,從個體智能轉化為群體智能。所以你會發現整個社會的本質上是一個超級MOE,這也是我們的底層邏輯。
我覺得在這個階段,你讓大腦的智商再繼續上升,其實邊際效果已經下降了,不經濟了。同理,今天的模型已經足夠強了,我們如何在今天給模型構建一個大學,讓他從一個標準的智商轉變為無數跟業務耦合的最優解,從而實現從個體智能到群體智能的飛躍。這也完美符合了OpenAI的AGI的五條路的level 4和level 5。所以我們做這件事的原因其實是基礎模型的延展。
許四清:那你覺得商業強化學習,最先在哪些場景上可以實現突破呢?
張帆:我覺得首先取決于我們怎么定義這件事。我們今天把它定義為是一個勞動力市場的事,而不是一個軟件市場。勞動力市場大概是一個50萬億美金的市場,比軟件市場大50倍。在這個市場中,我們的切入有兩個選擇標準,一個是今天的市場規模,今天有哪些工種所占的市場份額是最高的,肯定是我們優先選擇的。第二個就是哪些工種,今天是可以完全在數字空間里解決的,也會是我們優先選擇的對象。
許四清:你曾經提出整個AI行業存在供給熱需求冷的狀況,企業也會被這種狀況帶入這個焦慮驅動的采購陷阱,你覺得你能改變這個采購陷阱嗎?
張帆:這件事兒是一個很明確的觀察,我們發現今天其實是一個供給跟需求極度錯配的市場。具體來說,今天所有的人,包括一級二級市場,針對于供給側幾乎是無條件投入。大家會要更強的芯片,更大的集群和更強的基模,capex也從24年的2000億美金提升到了25年的4000億美金,明年可能就萬億以上。另一方面,模型的成本逐步下降,芯片的性能逐步提升,未來三年我們可能會比現在多1000倍的token的產量,但大家從來沒有懷疑過它能不能被消耗掉。大家都認為,只要算力足夠便宜就一定能被消耗掉,我覺得這個其實是不一定。
那么我們再看需求側,MIT之前有一個分享講到今天大概只有5%的PUC是真實落地并且帶來了數百萬美金的收益。這個跟我們過去兩年在整個市場上看到的情況是高度近似的,今天大模型落地是極其單調和重復的,無非就是chatbot、知識庫、合同審核,打標簽等,其實根本就沒有切入到核心業務,有點像具身領域大家都在翻跟頭,但是沒有真正進流水線的邏輯。
許四清:這個非常有意思。所以你看到了大家在大煉鋼鐵一般煉模型和芯片,但你沒有看到大家在需求側把這些練好的模型和芯片用到極致,你就是想解決這個問題是吧?
張帆:對,我想解決這個問題。我覺得AI其實更多對標的是電力,你會發現電力是通過影響物理世界的方式在影響人類的生產生活,比如說是電梯讓整個城市從平面變成了立體,改變了我們所有人的居住方式,房地產業,城鎮化,地鐵交通一切問題,而不是電力本身。所以今天AI也需要嵌入物理世界,這就是為什么我們覺得TOB很重要。
但是如果要嵌到物理世界,最大的問題就是在于:一個是效果如何直觀觀測,一個是成本如何下降。原來我們所有AI界的人,大家都在做一件事,叫做為知識建模。無論是垂類還是通用,我們都是把人類世界所有知識壓縮到一起放進去,然后壓縮成一個模型。這種方式確實有一定的通用性,但是我們任然認為將來會出現無數個專業模型,這就意味著我們不能再靠人標了。今天對于模型的調優策略是極度局限的,就是做SFT、prompt優化、workflow,我不認為這能走到一個真正的終局。所以我們覺得必須要找到一個大一統的方式,用一個標準的手段解決一切垂類環境跟模型的最優匹配。
寄語2026
孫洋:2026年,我覺得會是非常爭議的一年。這個爭議點在于AI產品上可能會出現的百花齊放,以及大家認為26年可能會有很大的bubble。
張玉峰:希望兩邊的學術、技術、產業都能夠快速發展,尤其是這個兩地之間的交流、合作、協同能夠越來越順。
張帆:我覺得26年會是一個AI真正進入物理世界的元年,也是一個商業強化學習落地的元年。25年更多的價值體現在了供給側的財報,比如英偉達,但我期望26年,我們能看到AI可以給二級市場AI帶來了明顯的業務價值的提升。
戴若犁:我們是服務具身智能這個行業的,所以我個人的期待其實很樸素:一方面希望馬斯克身體健康,繼續把人形機器人這條路線往前推;另一方面希望這一波具身智能創業公司都能走得穩、走得遠,希望我的客戶們都越來越好。
Kay Feng:首先26年還是希望AI行業更好,更多的客戶的產品走過PMF的階段,到達go to market的階段,希望大家的產品能夠在全球更多地區扎根。
許四清:我對2026年的期望是,具身智能的落地前景能從此變得更加光明。目前具身智能面對的探索環境與大語言模型截然不同,受限于數據匱乏,行業只能在“小腦”層面進行探索。我希望2026年大家能將探索重心轉向“大腦”層面,為具身智能的突破奠定基礎。(本文首發于鈦媒體APP,由鈦媒體編輯陶天宇整理)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.