![]()
距離ChatGPT的橫空出世,已經過去了三年。
三年時間,市場對于AI的熱情并沒有絲毫褪去,反而賭注越下越重。但在資本持續加碼的喧囂背后,盲目的興奮感正在被一種具體的焦慮所取代:這波AI浪潮的終點到底在哪?什么才是落地的正確姿勢?
在大多數人還在仰望AGI(通用人工智能)的頂峰,或者迷失在對話框里的時候,未來式智能聯合創始人兼COO鄒陽給出了一個冷靜且獨特的判斷。
“沿著大語言模型這條路大概率不能登頂AGI。不過這不重要我也不關心。重要的是,在半山腰足夠改變世界。”
在鄒陽看來,半山腰的技術能力,已經具備了全部產品落地產生價值的可能性。AI真正的戰場不在于做一個陪聊的聊天機器人,而在于潛入產業流程,成為企業里那80%重復、高頻、規則與判斷聚合的腦力工作的“外接大腦”。
這種判斷力,源自鄒陽在AI行業深耕多年的體感。
![]()
鄒陽算得上經歷了AI 從 1.0 走向 2.0 的完整周期。從魅族 AI 實驗室,到搜狗語音交互技術中心,再到阿里巴巴達摩院,他的職業路徑幾乎與行業演進同步。
在達摩院期間,他負責的智能語音語義產品線連續多年在國內AI 云服務市場占據第一,屬于那批最早把技術推向大規模商用的人。
他見過人工智能被視為“云資源鉤子”的年代,技術存在,卻難以真正被使用;也親歷了模型能力跨過臨界點的那一刻——從“能用一部分”到“可以被依賴”。這段長期浸泡在產業現場的經歷,也讓他對今天的 AI 浪潮有著不同的理解。
正因為如此,鄒陽成了最早選擇下場創業的那批人。
2023年6月,當AI Agent(智能體)概念尚處萌芽階段時,他與來自達摩院的老同事楊勁松共同創立了未來式智能。團隊迅速推出了國內首個企業級智能體構建平臺——“靈搭”,并一頭扎進了電力、能源、制造等最“重”的行業場景中。
在他看來,與其焦慮技術何時登頂,不如先在半山腰把那些難卻正確的價值實現,在企業里規模落地。
以下是他的思考與實踐。
大模型迭代,陷入“自證陷阱”模型
硅基君:GPT發布的時候,你還在達摩院,當時第一反應是什么?
鄒陽:ChatGPT出來前,算是AI 1.0時代,能規模化落地的事情非常少。很多人工智能技術其實就是幫云資源當“鉤子”的。你把技術秀一下,客戶覺得牛逼,就買了云服務,但AI技術本身在當時普惠性非常低,投入與產出也完全不成正比。
當時達摩院內部,其實對GPT3.5有預期,21年達摩院在云棲大會上發布了一個百億參數量大語言模型AliceMind,當時還是勁松發布的,我們的結論這技術拿它做做海外電商廣告文案這種高容忍度的場景還行,但也僅限于此了。
GPT3.5發布以后,我大概一個月的時間處在完全的焦慮過程中。打個比喻,就是玩了60年的游戲正式版突然上線了,新手村最后一道怎么也越不過去的門打開了。但是一出村就發現,這個游戲的世界可能全變了,你都不知道要往哪兒走,甚至連刷出來的怪物都是你以前從來沒有見過的。
作為一個專業的高玩,焦慮來源于你需要對新世界的底層機制有一個通盤的了解,你得知道在這個世界,什么是能做的,什么還不能做。
我一直想像盧娜他爹(哈利波特里的一個角色)一樣出本雜志,名字也叫《唱唱反調》。焦慮過后,我得出了幾個判斷:
第一,沿著大語言模型這條路大概率不能登頂AGI。不過這不重要我也不關心。重要的是,在半山腰足夠改變世界。現階段,全行業真的可以被這半山腰的技術全部重新改造一遍,產生極大的普世價值。
第二,這波技術革命最大的價值,短時間內,我覺得不在聊天框里,什么陪伴、心理、真人,toC的下班用場景。不是說技術達不到,只是不靠代際差相關產品心智形成不了,也非常考驗產品和技術的磨合,沒有長期主義的匠人是造不出來的,且一定還需要硬件創新配合。
這波技術革命最大的價值,是可以把上班場景里80%“照章辦事”的完全用新技術給一線的打工人們賦能,把他們從無聊的工作中解救出來,去思考更有價值的事情;對企業來說,日常的知識性的工作也可以像生產車間一樣,構造出一條知識加工的流水線,完成高頻、高重復度、高標準化的低智力密集型的知識工作。
23年3月份我們開始組隊創業,到現在我們也在一直是這樣踐行的。
硅基君:從ChatGPT發布到現在已經三年了,你對AGI這個判斷有變化嗎?
鄒陽:沒有。
普通人有一個很好的思想上自我防衛的武器,叫做常識,確實需要以史為鑒、總結經驗來給它不斷升級。
這一波真正跨過“奇點”的是 GPT-4,而不是 GPT-3.5。
我認為,GPT4真正完成了一次全人類級技術的革命性飛躍,后面想在短短幾個月內,甚至幾年內再來一次同量級的飛躍,幾乎不符合技術發展的常識。
回看人類技術發展史,第三次科技革命到現在也有近百年,從2018年Transformer發布,到現在,也不過小幾年的時間,曲線很難在一個里程碑之后立刻再次陡直上沖,怎么也得20年。
從技術角度看,Transformer 這條主干從 2018 年確立以來,行業更多是在同一套框架里做工程化優化和漸進式改良。如果底層范式沒有新的迭代,僅靠繼續堆數據、堆算力,很難再復刻一次類似 GPT-4 的再造“奇點”。
硅基君:這是一種基于歷史經驗的直覺,還是有判斷的依據?
鄒陽:從個人體驗上來說,最近一堆新模型發布,只要你去用,你就能知道新模型相較上一代也并沒有帶來質變,對于一個Prompt Engineer的熟手來說,只是更省你的事兒了。
當然,benchmark 上能看到一些提升,但我們做應用的更看重“真實場景里能不能把原來做不動的事做動”。至少在我們第一時間拿它去打那些舊模型解決不了的問題時,結果并沒有質的改變。
舉個最直觀的例子:分類。我們把業務規則盡量用提示詞梳理清楚,做上下文工程,讓模型去做一千多類客服業務反饋的細粒度分類。上一代模型的準確率大概在70%–80%,新模型也就多提高了幾個百分點,時效性、上下文長度、幻覺,都存在,多少的問題。
這就帶來一個問題:如果從大廠的宣傳口徑看,投入巨大、聲量很大,今天這個超越了一切,明天那個又超越了昨天的。按理說能力應該“肉眼可見”地躍遷,但落到應用側只漲幾個點,說明技術本身正進入明顯的邊際遞減階段——更新還在繼續,但很難再靠同一路線再上一個大臺階。
所以,你會看到,行業大量工作開始變成“修修補補”:更好的對齊、更強的工具調用、更穩的輸出、更低的成本。這些改進很重要,但它們更像工程化增量,很難單靠這種補丁式迭代再產生一次結構性的巨大變革。
這種投入狀態,有點像感情里的自證陷阱:對方說“你不愛我了”,你就開始拿無數小細節去證明“我愛你”。證明越多,反而越說明問題不在細節,而在底層邏輯本身就站不住。
硅基君:那怎么看待o1模型的成功,在很多人看來,它代表一種新的擴展范式?
鄒陽:o1確實是一個里程碑,但我的觀點是它更多是來自于機制的創新。
它是在模型內部自動生成思維鏈(Chain of Thought),用這個機制去提高推理效果。但模型本身的理解和推理能力的上限,還是由基礎模型決定的。這就相當于你給一個普通人更多的時間去思考,他確實能表現得更好,但他并沒有變成天才。
硅基君:當大量資本涌入AI行業,會不會加速下一個奇點的到來?
鄒陽:我更傾向于把“下一次AI范式突破”看成一類極少數問題:它屬于那一小撮同時具備頂尖智力、方法論和研究自由度的人,而不是靠更多資本砸進去就能解決的事。
錢當然重要,但在這種層級的問題上,邊際效用會迅速下降,資本多到一定程度也未必能換來突破。就像llya說的,科研確實需要算力,但并不需要絕對最多的算力。真正需要的是正確的問題和新的方法。
真正的階躍式突破,往往需要的是少數科學家帶著一個高強度的小團隊(今后可以是AI了),配上先進的工具持續攻堅,資源不一定要無限大,但組織要足夠專注、足夠聚焦。然后,再加上好運氣。
硅基君:如果說Scaling Laws結束了,這對AI行業意味著什么?
鄒陽:我覺得會帶來兩個變化。
第一,資源分配要變。除非你是那種少數具備“跨越式突破”能力的頂級團隊,否則不該繼續把主要資源和精力押在追下一次大臺階上。更現實的選擇,是把現有資源拿來,踏踏實實嵌進業務,做工程化、做產品、做閉環。
第二,應用的窗口期其實已經到來。原因不是“模型進化多快”,而是相反:模型能力的增量變小了,反而意味著邊界更穩定、技術投入回報可預期性更強。
同時,當前模型能產生業務價值的能力已經足夠,你完全可以基于它重新梳理流程、重做場景,把過去做不動的事做成可規模化的產出。
行業經驗的結構化復制,才是這波AI最大的價值
硅基君:如果AI技術停留在“半山腰”,應用機會在哪里?
鄒陽:我覺得之前市場被帶偏了。23年、24年,大家關注的精力主要都集中在模型上。超大客戶花幾千萬去買一個閉源模型,這種情況在國內屢見不鮮;隨之而來的是模型效果不好,然后就微調,各種調。
不是說微調沒效果,微調開源模型是對數據、算力、人才要求都非常高的一種提效方式,應該在判斷現有模型能力不足時候,嘗試使用。
感慨的是,即使在當前25年都要結束了,好多人還是沒有正確掌握通用大模型的使用方式。
現在談模型應用,誰要在我面前說,把這些數據訓練一下,讓模型學習一下,就成判定基本是個外行。
新技術的最大價值是它真的可以成為一個真正意義上的“數字專家”,解決產業上所有知識性工作無法流水線化的問題。
硅基君:展開說說?
鄒陽:舉個例子,在電力系統中,特高壓換流變設備,很精貴,每年因為它導致的系統停運占比高達40%。長期高壓高熱,內部的絕緣油在局部放電、過熱和受潮的時候,會裂解出類似氫氣、乙炔、一氧化碳等等氣體。
以前這項工作全靠老師傅定期巡檢,老師傅會看傳感器給出的數據,進行計算、比對,結合幾十年來的經驗和直覺,大概率可以對故障進行判斷,進行預防性檢修。但是人會出錯,也無法24小時時刻值守。
但如果你把老師傅的工作進行拆解,它做的工作無非就是閱讀傳感器的數值,進行計算,按照計算的結果去查詢手冊,來進行“照章辦事”。
我們現在讓智能體來模擬老專家,對故障進行判斷。比如,簡單的各種氣體的比值計算和預警,無非就是把傳感器的各種接口對接上,實時獲取數據,然后計算相關的特征值,氫氣的含量和增速,乙烯和乙炔的比值等等,然后查查手冊,判斷是否需要注意和報警。
面對一些復雜的問題,智能體通過調用知識庫(歷史案例庫),也能給出可能的原因。
比如,數據顯示某三個比值異常,系統在數據庫里找到兩個“非常相似”的歷史案例,針對案例的詳細內容展開分析,提取不一樣的點,再結合處置手冊和現有數據及歷史數據的差異,讓模型去做特定范圍的推理。
硅基君:這相當于把專家經驗進行“結構化復刻”,那我們怎么抽離這種規則呢?
鄒陽:調研。我們只需要把問題問清楚,讓專家按自己的語言回答就行了。一次一小時的訪談,結合大模型就能把這套業務邏輯整理得清清楚楚,配合圖譜的技術,沉淀成結構化知識。然后再讓專家來修改完善,這在過去幾乎是不可想象的。專家自己寫不出經驗,技術人員問不出專業問題。
更重要的是,企業里大量散落的“過程文檔”——方案、手冊、郵件往來、各類內部記錄,現在都能被模型讀懂、分類、提煉。人機協同,能自動把隱性的經驗抽出來,變成顯性的、可復用的邏輯。
通過以上兩種方式,企業就能把自身的“運轉規則”真正完整地沉淀下來,再拆解一個個場景的具體需求,圍繞這些場景去做成一個能穩定運行的智能體。
硅基君:現在大模型能干的事,以前的AI干不了嗎?
鄒陽:干不了,原因有兩點。
一是成本,你得把所有規則寫成if-else,邏輯梳理得極其精細,一點歧義都不能有。成本巨大,而且基本無法覆蓋真實業務里的復雜性。一線情況或者其中一個環節變了,你還得花大量的資源更新迭代。
二是大部分業務規則來自于一線業務員的經驗,在電網、制造業,那些最有價值的經驗掌握在老師傅手里。他們不懂代碼,也寫不出SOP(標準作業程序),甚至溝通也比較費勁,但他們看一眼就知道變壓器的數據,憑直覺就知道哪里有問題了。
這種“隱性經驗”,是傳統AI無法處理的盲區。
大模型帶來的真正革命,是它讓“經驗邏輯”變成了可以理解的東西。師傅總得帶徒弟,你讓老師傅像教徒弟似的用大白話講出他的判斷邏輯,模型就能讀懂,并結合現場數據就可以給出解決方案。
硅基君:在電網檢修這種工作下,用大模型做判斷,會不會不夠嚴謹?
鄒陽:我覺得我們在搞工程落地,看的是效果。這也是這次技術革命要改變的一個認知。
有人覺得既然都是機器工作,那業務場景里的判斷必須像傳統軟件一樣嚴絲合縫,正確率必須達到100%。但在真實的基層一線,幾十萬工作人員每天都在憑經驗做判斷。那為什么一個能力比老師傅更穩定、不疲勞、不走神、邏輯更一致的AI,反而不能用?
硅基君:電網變壓器只是一個很小的場景,您覺得類似變壓器這種適合AI落地的場景還有多少?
鄒陽:變壓器只是電網系統里很小的一個設備,一個變壓器可能有100個場景,一個變電站可能有1000個,理論上所有的故障研判的方式都能用類似的方法來完成。國家電網130多萬的員工,干這種一線的設備檢測的,十萬人是有的。
放在其他行業,這樣的場景可能更多。絕大多數人日常做的,其實是依照前輩經驗、照著SOP 一條條往下走的流程性工作。無非就是部分場景規則復雜一點,需要注意的事情多一點。那他總歸要教徒弟的,他但凡他能教徒弟,他就一定能教大模型。
我覺得一家企業里80%-90%的工作,都是類似照章辦事的工作。所謂“腦力工作”,其實很多也只是照章辦事、沿著經驗走流程。
最近聽我朋友說一個案例,一家全球頂尖的制造業廠商,他們要為某款設備開發一款新的材料,需要具備一些特殊屬性。流程是這樣的:
工程師先上Google、百度查資料,看論文,搜文獻,再回到企業自有的知識庫和自己的硬盤里里翻以前的項目報告,找有沒有類似的案例。
然后憑著經驗和直覺,在腦子里形成一個大致的方案:材料選哪些、比例怎么配、怎么混合、預計效果如何。最后再根據這個方案去實驗室配料、測試、出結果。
聽起來像是一個“高智商、高門檻”的流程,但你仔細看,本質就是經驗復用 + 文獻檢索 + 配方組合。模型現在的能力,已經完全覆蓋了一個化學博士所需要的知識深度。
只要對老專家的工作流程拆解的足夠細致,基于大語言模型的智能體完全能復刻這些專家的隱性經驗和實現方式。
它不僅能理解需求,還能自動從歷史文檔里找出相關材料,生成配方方案,甚至連“為什么要這么配”的依據都能解釋清楚。過去一個工程師要花幾天甚至幾周才能做出的初步方案,現在模型幾分鐘就能做出來。
硅基君:從梳理行業Know-how再喂到AI,最終輸出智能體解決方案,整個過程需要多久?成本又是多少?
鄒陽:這個過程確實需要人,但投入是可控的。三到六個月,就能把一位資深專家腦子里的判斷邏輯、經驗路徑梳理清楚,做成一個可部署的數字專家系統。
接下來要做的,只是把這些“邊邊角角”補全。剛才說了,一個變壓器可能有100個場景,一個變電站可能有1000個,一個城市可能要覆蓋上千、甚至上萬個場景。把所有場景都做完,確實需要三到五年,有些行業甚至可能要十年。
更關鍵的是,規模化的成本很低。以前的規模化是復制真人,復制真人的成本非常高,選拔、學習、實踐,幾十年就過去了,還有學習效果漏斗和人本身的缺點。現在不同了,當你用大模型把一個城市幾千個場景落實一遍,數字專家就像軟件一樣,可以直接復制到下一個城市、下一個省份,無病無災,24小時不間斷工作,邊際成本幾乎趨近于零。
硅基君:當下,AI技術在場景落地的關鍵是什么,技術還是其他因素?
鄒陽:AI技術的革命性已經足夠大,足以顛覆很多行業,但真正稀缺的是“會用的人”。
我再把話說直白點,目前模型能力大致相當于一個“普通博士生”。你就算招頂尖的博士生進公司,不給背景、不教業務、不搭流程,就指望他們憑直覺直接把工作做成,這是不可能的。
很多高價值、復雜的工作,并不是模型自己完成的,而是“人帶著模型一起做出來的”。像陶哲軒這類頂級數學家,能把 AI 變成解決難題的工具,換一個不具備相同方法論和判斷力的人,哪怕拿到同樣的模型,也做不出同樣的結果。
硅基君:這類人具備什么樣的特質?
鄒陽:我覺得主要有兩點:第一,要知道現有AI的能力邊界在哪;第二,要知道怎么把能力嵌進任務、流程和評價體系里。
這種人往往不是純技術專家,也不是算法工程師,更不是研究型科學家,而是產業里的工程應用型人才:既懂業務結構,又理解模型能力邊界,配合AI完成可交付、可復制、可持續優化的系統。
這類人現在非常少,甚至在我看來比算法工程師更稀缺。但是基于這次革命性技術的軟件會越來越面向業務人員,賦能他們具備這種技術能力,讓普通業務人員只要會畫流程圖、會結構化表達,就可以利用數字化工具給自己降本提效。
科技平權平的是普通人也可以用AI來構建數字化應用解決自己真實需求的權利。
硅基君:這會對當下的TO B生態有什么樣的影響?
鄒陽:我有一個暴論,未來大型企業可能不需要那么多的外部供應商了,尤其是那些靠堆人力的服務模式也會被替代。
過去企業做不了數字化,是因為找不到足夠懂業務、懂軟件、懂流程的人;數字化成本高、周期長、失敗率還特別高,所以才需要各種外包或者服務商來幫它們“補足能力”。
但未來不一樣。當企業擁有了自己的模型、自有的數據、第一手的場景,加上一兩支懂得使用模型的小團隊,大部分傳統意義上的“外部開發能力”都會被內化。
硅基君:什么樣的toB公司能活下來?
鄒陽:我認為只有兩類:一種是掌握行業Know-how ,另一種是有數據積累的公司。
硅基君:垂直大模型的概念逐漸被證偽了,那垂直Agent會存在嗎?
鄒陽:垂直大模型和垂直Agent是兩碼事。模型是能力,Agent 是商品。就好像一個醫療行業的專家,并不意味著他能解決醫療場景里所有具體的問題。
垂直大模型不成立是因為性價比太低,通用大模型已能解決80% 的問題。而垂直 Agent 的核心,是把行業里的碎片化規則轉成可被大模型調用的指令和流程。它賣的不是模型能力,而是“最后一公里”的解決方案。
中國強調系統性落地,美國聚焦單點需求
硅基君:怎么看待中美在AI上的路線差異?
鄒陽:中美的差異既有客觀原因,也有主觀原因。
客觀原因很好理解,國內算力確實緊張。很多團隊不是不想做,而是沒有那么多卡。
國內一家號稱發力AI的大廠,手里只有5000張卡。算力不足的直接后果,是模型無法在細節上做足夠多的實驗。國外是一百個方向同時跑,國內往往只能盯住十分之一。
這就決定了大模型的創業公司在國內很難干成,能做這件事的,只有大廠。
硅基君:那主觀原因呢?
鄒陽:中國無論是產業政策,還是企業決策都更加務實。技術能不能解決生產環境里的實際問題,是判斷的第一原則。解決不了,就不會投,也不會引進;解決得了,就迅速推進。
這種態度和過去一些技術潮流形成對比:當年區塊鏈、元宇宙、大數據都曾被大規模追捧,但真正落地的非常有限。經歷過這些周期后,中國企業對“價值驗證”這件事變得更敏感。
這和國外靠資本推動的邏輯完全不一樣。國外可能一家三五個人的創業公司,估值幾千萬美元是常態。資本互相買、互相推,高估值本身就是玩法的一部分。泡沫會積累,也遲早會破一次。但從長期看,AI 的價值又確實不屬于泡沫,它能在十年尺度上帶來深刻的結構性變化。
硅基君:這種路線差異,會帶來什么樣的結果?
鄒陽:美國的AI 落地更多是自下而上的,圍繞商業場景里的明確問題展開。法律、財務、內容審核,這些環節清晰、邊界清楚,也容易驗證效果。大多數美國 AI 公司,最終還是走向具體、可快速變現的工具化產品。
中國的路徑有自己的特色。國內企業把AI 放進了生產的核心環節:排產、工藝、設備運行、供應鏈調度。這些場景復雜、周期長,短期并不會產生可見回報,但關系到企業的底層效率,所以持續在投入。國企的參與更典型,很多項目前期投入大、見效慢,卻依然愿意長期建設。
因此,我們選擇的方向,是往更細更深的地方走。不是只做幾個容易驗證的點,而是進入真正的產業現場,去拆解、解決那些分散在千行萬業里的具體問題,再把這些經驗沉淀成更通用的能力體系。
只有讓技術在最難、最碎、最真實的業務里接受檢驗,才能判斷它的真正邊界。未來真正改變企業運行方式的,也不會是幾個亮眼的demo,而是這些深埋在流程里的突破。
文/林白
PS:如果你對AI大模型領域有獨特的看法,歡迎掃碼加入我們的大模型交流群。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.