本文探討了AI發展的三個關鍵觀點:縮放定律依然有效但受到成本和產品形態的約束;推理能力的提升為大模型帶來了真正的增長飛輪;成本、算力和電力成為決定AI勝負的關鍵因素。
———— / BEGIN / ————
起因是看了一位海外的科技投資人寫的長文,總結了他對當下和未來的一些判斷,因為原文太硬核,我抽出了幾個觀點,用更好懂的方式和大家聊聊:
縮放定律還活著,AI 沒有「撞天花板」,只是換了一個加速方式;
推理能力改變了大模型的商業邏輯,讓 AI 終于擁有了真正的「增長飛輪」;
成本、算力和電力,第一次真正變成了決定 AI 輸贏的底層變量。
縮放定律沒死,只是效果被遮住了
先解釋一個最近大家經常聽到的概念:縮放定律(Scaling Law)。
簡單說就是:在一定范圍內,你給模型更多的算力、更大的模型規模、更好的數據,性能大概率會持續提升,而且提升和投入之間有相對穩定的關系。
過去幾年,GPT 系列、Gemini 系列、Claude 系列,本質上都在用這個定律吃紅利。
但過去一年有個現象:很多人覺得模型迭代沒以前驚艷了。
比如:GPT-5 沒有碾壓上一代;各家新模型體驗差不多,甚至有時候不如以前穩定。
于是就開始有人問:是不是縮放定律已經到頭了?
那位投資人的觀點是:不是定律失效,而是產品目標變了。
以 GPT-5 為例(他是從一線投資視角給的判斷):
它并不是盡可能堆料、追求最強性能的模型;
而是刻意往便宜推理去設計,更像一個更小的模型 + 智能路由的組合;
目標是:在成本可接受的前提下,給盡可能多的用戶提供足夠好的體驗。
也就是說,產品團隊踩了一腳剎車,不是引擎沒辦法再加速。
另一方面,像 Gemini 新一代模型在更大規模、更協調的算力集群上訓練之后,性能還是有明顯抬升,這說明:
在基礎研究和預訓練層面,縮放定律依然在發揮作用,只是現在多了一條「成本和產品形態」這條約束線。
對做產品、做投資的人來說,更重要的不是爭論「有沒有奇點」,而是承認一個現實:
短期看,模型體驗的提升確實不會像 2022 年那樣一夜之間翻倍;
長期看,只要算力和數據還能往上堆,AI 這條曲線還沒到拐點。
一句話總結就是:
體驗變平緩,不等于技術停滯;AI 現在更像是在從「炫技階段」進入「算賬階段」。
推理能力,第一次給了大模型一個真正的增長飛輪
第二個被嚴重低估的點是:推理能力(reasoning)改變了大模型的商業邏輯。
以前的大模型,本質上更像一個高級自動補全:你給它一個問題、一個提示,它在訓練好的概率分布上,選出最可能接下來的那一串字。
這種模式下,提升模型主要靠兩件事:一是多花錢預訓練;二是不斷在互聯網上撈更多數據。
問題是,這種只靠預訓練的縮放方式,飛輪很弱:
模型用得多 ≠ 模型變得更好;
用戶給你的數據,很多也只是一次性的對話記錄,很難真正沉淀到產品里。
而現在的推理模型發生了什么變化?
它們開始具備了多步思考、拆解任務的能力;
它們可以在解決問題的過程中,自己生成鏈式推理過程、工具調用軌跡、錯誤修正記錄;
這些過程本身,就可以被拿來再次訓練模型,變成更高質量的「自己教自己」的數據。
這意味著什么?意味著我們終于有了一個閉環:
模型推理 → 產生結構化的高質量數據 → 喂回模型 → 模型推理更好 → 吸引更多用戶 → 產生更多數據……
這其實就是互聯網行業最熟悉的那個飛輪:
「用戶 → 數據 → 產品變好 → 更多用戶」,只是這次發生在 AI 模型層。
這也是那位投資人強調的一點:
在只有預訓練、沒有推理的時候,AI 缺的就是這個飛輪;有了推理之后,前沿模型的護城河,開始變成「數據 + 使用頻率 + 閉環設計」。
第一次,成本決定了誰贏:Token和電力
過去二十年,大部分科技巨頭的成功,都不是靠最低成本取勝:
iPhone 從來不是最便宜的手機;某些 GPU 也不是最便宜的算力芯片。
但在這一輪 AI 里,那個投資人的感受是:
這是他職業生涯里第一次,成本如此關鍵。
原因很簡單:
大模型的產品在很大程度上就是 Token,也就是模型吐出的字、代碼、回答;
每產生一個 Token,背后都要燒電、燒顯卡、燒網絡;
對云廠商和大模型公司來說,誰能以更低的成本,穩定地產生大量 Token,誰就擁有更厚的基礎設施護城河。
這里有兩個關鍵信號:
1. 比顯卡數量更重要的,是顯卡之間能不能好好協同。
很多人喜歡問:某家公司有多少 GPU?但在真正做大規模訓練的人眼里,更重要的是:
這些 GPU 是怎么連在一起的?
一個集群里有多少是可以互相快速通信、像一個整體一樣工作的卡?
通信成本和失敗率有多高?
所以,你看到他用的詞不是「多少卡」,而是「coherent FLOPs」:大致可以理解為「真正能協同起來干活的有效算力」,而不是裸算力。
這就是為什么一些公司在同樣的卡數下,能訓練出更好的模型、用更低的成本提供推理服務,它們在網絡拓撲、軟件棧、機房電力和散熱設計上,做了別人看不到的重投入。
2. 當電力成為瓶頸時,游戲規則只剩一句話:每一瓦能產出多少 Token
另一個被低估的變量是:電力。
拉起一個大型 AI 數據中心,不只是買一堆機柜那么簡單:
你要有足夠的變電、配電能力;
要滿足當地對能耗、碳排、用電穩定性的各種要求;
很多地方現在已經開始對大型 AI 項目的用電做嚴格審批。
那位投資人的觀點反而是:這是個好事。
一是因為電力瓶頸會自然減緩 AI 基礎設施的過度擴張,避免一哄而上、然后一地雞毛;
二是讓整個周期變得更平滑、更長,而不是短期暴漲暴跌。
在電力受限的世界里,決策公式會變得非常簡單粗暴:每 1 瓦電,我能產出多少有效 Token?
如果某個 GPU 貴一點,但每瓦電產出的 Token 多很多,它反而是更好的選擇;
反之,即便某些方案在購置成本上便宜一點,但電力效率太差,長期 ROI 反而更低。
這對創業者同樣有啟示:
做應用層產品時,不要只看API 調用單價,還要關心在你的任務上,這個模型需要多少 Token 才能完成。
最后,站在一個更長的時間軸上看 AI。真正值得思考的,不是會不會是泡沫,而是:
在你的行業里,有沒有哪一塊高頻、可結構化、值得自動化的決策,還沒有被 AI 接管?
你能不能設計出一個越用越聰明的閉環,而不是一個用完就算的工具?
在一個算力、電力不再廉價的世界里,你做的每一個AI功能,真的值得那幾度電嗎?
以上,祝你今天開心。
本文來自公眾號:Fun AI Everyday 作者:張艾拉
2025AI產品大會,將于12月20-21日在深圳開幕!
聚焦“AI+行業”的落地實踐,分享AI在物流、音視頻、內容、數字化、工業制造、大數據、協同辦公、出海、具身智能、智能硬件等等領域的具體案例。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.