![]()
(圖源:MIT TR)
對 AI 產生一些幻滅感在所難免。
2022 年末,OpenAI 發布了名為 ChatGPT 的免費網頁應用,它改變了整個行業的走向,也改變了若干個世界經濟體的運行軌跡。數以百萬計的人開始和電腦對話,電腦也首次開始有了回應。由此,我們開始對 AI 抱有更多的期待。
而后,科技公司為了保持領先而競相沖刺,推出一款又一款各擅勝場的競品。語音、圖像、視頻,每一次更新都是青出于藍而勝于藍。在這種不間斷的比拼中,AI 公司把每一次產品上線都包裝成重大突破,進一步強化了人們的普遍信念:這項技術會越來越好。
AI 的鼓吹者告訴我們,進步是指數級的。他們曬出圖表,標出我們相較去年的模型走了多遠:看,曲線一路向上。生成式 AI 似乎無所不能。
但 2025 年卻成了清算的一年。
首先,頂級 AI 公司的掌舵者許下了他們兌現不了的承諾。他們告訴我們,生成式 AI 會取代白領勞動力,開啟富足時代,帶來科學發現,并幫助找到新的疾病療法。至少在全球北方國家,蔓延于各個經濟體的錯失恐懼(FOMO)讓 CEO 們撕掉舊劇本,急著加入這場行動。
也就是從那時起,光環開始褪色。盡管這項技術被包裝成一種“萬能多功能工具”,能夠重塑陳舊的業務流程、削減成本,但今年發表的多項研究顯示,企業并沒有讓那點“AI 仙塵”真正發揮魔力。
來自多個來源的調查與追蹤數據,包括美國人口普查局與斯坦福大學,都發現企業采用 AI 工具的勢頭正在放緩。而即便嘗試了這些工具,許多項目也長期卡在試點階段。
如果整個經濟體缺乏更廣泛的投入與認可,人們很難看出,這些大型 AI 公司要如何收回它們在這場競賽中已經投入的驚人資金。
與此同時,核心技術的迭代也不再像從前那樣帶來階式躍遷。
最典型的例子莫過于 8 月 GPT-5 的翻車式發布。在極大程度上造就了本輪 AI 繁榮的 OpenAI,原本要推出其全新一代技術,為此,OpenAI 連續數月為 GPT-5 造勢。CEO 山姆·奧特曼甚至夸口稱它是“任何領域的博士級專家”。
還有一次,奧特曼不加評論地發了一張《星球大戰》“死星”的圖片,OpenAI 的鐵粉把它解讀為“終極力量”的象征,仿佛在說:馬上就來。人們的期待被推到極高。
然而當它真的上線時,GPT-5 看起來像是與之前相同的東西又發布了一次。隨后出現的,是自三年前 ChatGPT 初次登場以來最大的一次氛圍轉向。
AI 研究者、知名 YouTuber 揚尼克·基爾徹(Yannic Kilcher)在 GPT-5 發布兩天后的視頻中宣布:“突破邊界的時代結束了。AGI 不會到來。我們看起來已經進入了大語言模型的三星 Galaxy 時代。”
很多人(包括我)都把它類比為手機。在差不多十年的時間里,智能手機是全球最令人興奮的消費科技。如今,蘋果或三星發布新機時幾乎不會掀起太大波瀾。鐵粉會細看每一點小升級,但對大多數人來說,今年的 iPhone 看起來、用起來都和去年的差不多。
生成式 AI 也到了這個階段嗎?如果是,這算問題嗎?當然,智能手機已經成為“新常態”。但它也確實改變了世界的運作方式。
需要承認的是,過去幾年確實充滿了許多激動人心的時刻。從視頻生成模型質量的驚人飛躍,到所謂推理模型的解題能力,再到最新編程與數學模型在世界級競賽中的勝出,這些都是真實發生的。
但這項非凡技術也才走紅短短幾年,從許多方面看仍處在實驗階段。它的成功背后也伴隨著諸多重要的限制條件——也許我們需要重新調整預期。
這里要小心:從“熱炒”到“反熱炒”的擺鐘也可能擺得過頭。僅僅因為它被過度兜售就否定這項技術,是輕率的。
當 AI 沒能回應期待時,人們的本能反應往往是說“進展撞了南墻”。但這誤解了技術研究與創新的運行方式。進步從來都是偶發的,時快時慢。墻是可以翻過去的,也可以繞過去,甚至可以從下面挖過去。
不妨把視角從 GPT-5 的發布上挪開一點。在它之前的幾個月里,OpenAI 剛剛密集推出了一系列相當出色的模型,包括 o1 和 o3(開創性的推理模型,讓行業見識到一種全新范式),以及再次抬高視頻生成門檻的 Sora 2。在我看來,這聽起來不像是撞墻。
AI 的確很強。看看 Google DeepMind 的新圖像生成模型 Nano Banana Pro,它能把一本書的一章內容變成信息圖,還能做更多事情。它就這么免費地躺在你的手機里。
但你還是忍不住會想:當“驚艷感”消退后,還剩下什么?一年后或五年后,我們會如何看待這項技術?我們會認為它值得付出如此巨大的成本嗎?無論是金錢成本,還是環境成本。
基于這些問題,下面是看待 2025 年末 AI 現狀的四種方式。這是一場迫切需要的熱潮糾偏的開始。
![]()
大語言模型不是全部
從某種意義上說,需要糾偏的是圍繞大語言模型的熱潮,而不是 AI 整體。如今已經很明顯,LLM 并不是通往通用人工智能(AGI)的入口。AGI 是一種假想技術,有人堅稱它終有一天能完成任何人類能完成的(認知)任務。
即便是像伊利亞·蘇茨克維(Ilya Sutskever)這樣的 AGI 傳道者,如今也開始強調 LLM 的局限性。蘇茨克維是 AI 初創公司 Safe Superintelligence 的首席科學家兼聯合創始人,曾任 OpenAI 首席科學家兼聯合創始人,并深度參與了 LLM 的創造。
蘇茨克維在 11 月接受德瓦克什·帕特爾(Dwarkesh Patel)采訪時說,LLM 很擅長學會做許多具體任務,但它們似乎并不會學到這些任務背后的原理。這就像學會解一千道不同的代數題,和學會解任何代數題之間的區別。
蘇茨克維說:“我認為最根本的一點是,這些模型在泛化能力上不知為何明顯比人類差得多。”
LLM 的語言能力太有說服力,因此人們很容易想象它無所不能。這項技術模仿人類寫作與說話方式的能力令人驚嘆。而我們天生就傾向于從某些行為方式中看見“智能”,不管它是否真的存在。換句話說,我們造出了具有人類行為的機器,于是很難不去相信它背后也有一個類人的心智。
這可以理解。LLM 進入主流生活也就短短幾年。但在這段時間里,營銷者利用了我們對技術真實能力還不夠穩固的判斷,不斷抬高預期、加速炒作。隨著我們與這項技術共處、對它理解加深,這些預期也該回到地面。
![]()
AI 不是解決一切問題的速效藥
7 月,麻省理工學院的研究者發表了一項研究,成了 AI 末日論者最常引用的支柱論據。其最醒目的結論是:高達 95% 的企業在嘗試使用 AI 后發現其“零價值”。
其他研究也呼應了這種總體判斷。11 月,自由職業者在線市場平臺 Upwork 的研究者發現,由 OpenAI、Google DeepMind 與 Anthropic 的頂級 LLM 驅動的智能體,單靠自己無法完成許多看似直接的職場任務。
這與奧特曼的預測相去甚遠。他在 1 月的個人博客里寫道:“我們相信,在 2025 年,我們可能會看到第一批 AI 智能體‘加入勞動力隊伍’,并實質性改變公司的產出。”
但那項 MIT 研究中常被忽略的一點是,研究者對“成功”的衡量很狹窄。所謂 95% 的失敗率,統計的是那些嘗試部署定制 AI 系統,但在 6 個月后仍未能把它們擴展到試點階段之外的公司。實驗性技術的許多實驗無法立刻見效,這并不令人意外。
這一數字也沒有把員工在官方試點之外使用 LLM 的情況納入。MIT 研究者發現,他們調查的公司中約有 90% 存在某種AI 影子經濟,員工在用個人聊天機器人賬號處理工作,但這種影子經濟創造的價值并沒有被測量。
而當 Upwork 研究觀察的是智能體與懂行的人協作完成任務的表現時,成功率就大幅上升。結論似乎是,很多人正在自己摸索 AI 如何在工作中幫到他們。
這也符合 AI 研究者、意見領袖安德烈·卡帕希(Andrej Karpathy)的觀察。他也是vibe coding一詞的提出者。卡帕希指出,聊天機器人在很多事情上都比普通人更強,比如給法律建議、修復漏洞、做高中數學題,但它們并不比專家更強。
卡帕希認為,這可能解釋了聊天機器人為何在個人消費者中如此受歡迎,它能幫非專業人士解決日常問題與任務。但它并沒有顛覆經濟,因為要顛覆經濟,就必須在工作上超越熟練員工。
這種局面也許會改變。但至少目前,AI 還沒有對就業產生鼓吹者宣稱的那種影響,這并不值得驚訝。AI 不是速效藥,也無法替代人類。但這盤棋還有很多空間。AI 如何被整合進日常工作流與業務流程中,仍在不斷試驗。
![]()
我們身處泡沫之中嗎?
如果 AI 是泡沫,它更像 2008 年的次貸泡沫,還是更像 2000 年的互聯網泡沫?兩者差別很大。
次貸泡沫吞噬了經濟體的一大部分,因為它破裂后留下的只有債務和被高估的房地產。互聯網泡沫則淘汰了大量公司,沖擊波擴散全球,但它留下了嬰兒時期的互聯網,留下了國際光纜網絡,也留下了少數后來成長為科技巨頭的創業公司,比如谷歌和亞馬遜。
但也可能,我們正處在一種不同于上述兩者的泡沫里。畢竟,LLM 目前還沒有真正成熟的商業模式。我們還不知道所謂殺手級應用會是什么,甚至不知道它是否會出現。
許多經濟學家也擔憂,前所未有的大量資金被投入到基礎設施中,用來建設算力并服務于預期需求。但如果需求最終并未出現呢?
再加上許多交易存在一種古怪的循環結構,比如英偉達付錢給 OpenAI,OpenAI 再把錢付回英偉達,如此往復。難怪每個人對未來的判斷都不一樣。
一些投資者仍然很淡定。11 月,在接受 Technology Business Programming Network 播客采訪時,國際大型私募股權公司 Silver Lake Partners 的聯合創始人格倫·哈欽斯(Glenn Hutchins)給出了幾條“不必擔心”的理由。他說:“這些數據中心中的每一個,幾乎所有,都有一個具備償付能力的對手方,并簽約承諾接收它們為其定制建設的全部產出。”換句話說,這不是“先建起來再等客戶上門”,客戶已經被鎖定了。
他還指出,這些具備償付能力的對手方中最大的一家是微軟。“微軟擁有全球最好的信用評級,”哈欽斯說,“如果你和微軟簽約,讓它接收你數據中心的產出,薩提亞(納德拉)是靠得住的。”
許多 CEO 會回望互聯網泡沫,試圖從中吸取教訓。可以這樣理解:當年倒下的公司沒有足夠的資金撐到最后;而挺過崩盤的公司則迎來繁榮。
帶著這個教訓,今天的 AI 公司試圖用資金把自己“買”過一段可能是泡沫也可能不是泡沫的時期。留在賽道上,不要掉隊。即便如此,這仍是一場孤注一擲的豪賭。
但還有另一條教訓。一些看起來像“邊角料”的公司也可能很快變成獨角獸。以 Synthesia 為例,它為企業提供虛擬人生成工具。風投機構 Air Street Capital 的聯合創始人內森·貝奈奇(Nathan Benaich)承認,幾年前他第一次聽說這家公司時,正值深度偽造(deepfakes)引發恐慌的時期,他并不確定它的技術能用來做什么,也認為這不會有市場。
他說:“我們當時不知道誰會為對口型和聲音克隆付費。結果發現,愿意付費的人很多。”Synthesia 現在大約擁有 5.5 萬家企業客戶,年收入約 1.5 億美元。10 月,這家公司估值達到 40 億美元。
![]()
ChatGPT 不是開始,也不會是結束
ChatGPT 是深度學習十年進步的結晶,而深度學習正是現代 AI 的底座。深度學習的種子早在 20 世紀 80 年代就已埋下,這個領域的整體歷史至少可以追溯到 20 世紀 50 年代。如果以這樣的背景衡量進步,生成式 AI 才剛剛起步。
與此同時,研究熱度已經到了沸點。全世界范圍內主流的 AI 會議收到的高質量投稿比以往任何時候都多。今年,一些會議組織方為了控制數量,甚至不得不拒絕那些評審已經通過的論文。(與此同時,arXiv 等預印本平臺也被 AI 生成的“學術垃圾”淹沒。)
蘇茨克維在那次與德瓦克什的訪談中談到 LLM 當前的瓶頸時說:“我們又回到了研究的時代。”這不是挫折,而是新事物的開端。
貝奈奇說:“總會有很多‘炒作怪獸’。”但他認為這也有好的一面:熱潮會吸引實現真正進步所需要的資金與人才。
他說:“你知道,就在兩三年前,構建這些模型的人基本還是研究宅,只是碰巧搞出了某種可用的東西。現在,幾乎所有在技術上真正厲害的人都在做這件事。”
![]()
接下來我們往哪里走?
這種無休止的熱潮,并不只是來自公司為其成本極高的新技術招攬生意。還有一大群人,無論在行業內還是行業外,都愿意相信一種承諾:機器可以閱讀、寫作、思考。這是一個持續了幾十年的狂野夢想。
但熱潮從來就不可持續,而這反倒是好事。我們現在有機會重置預期,看清這項技術的真實面貌,評估它真正的能力,理解它的缺陷,并花時間學習如何把它用在有價值而且有益的地方。
貝奈奇說:“我們仍在摸索,如何從這個維度高得離譜的信息與技能黑箱中,調動出我們想要的特定行為。”這場熱潮糾偏早就該來了。但要知道,AI 不會消失。我們甚至還沒有完全理解自己迄今為止造出了什么,更不用說接下來會發生什么。
https://www.technologyreview.com/2025/12/15/1129174/the-great-ai-hype-correction-of-2025/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.