![]()
新智元報道
編輯:傾傾
【新智元導讀】o1從榜首暴跌至#56,Claude 3 Opus墜入#139。LMSYS榜單揭示殘酷真相:大模型的「霸主保質期」只有35天!這不是技術迭代,這是對所有應用層開發者的降維屠殺。
還記得OpenAI o1剛發布那會兒,整個科技圈那種近乎朝圣般的狂熱嗎?
那時,朋友圈被瘋狂刷屏,我們篤定它是跨時代的神跡,是降維打擊,是通往AGI的「諾亞方舟」。
![]()
2024.9.13排名
然而,現實比爽文爛尾更讓人猝不及防。
僅僅幾個月,這位曾經的「版本之子」就從云端跌入泥潭,排名直接俯沖到了第56位。
就連那個曾被譽為「最強推理王」、讓無數開發者跪著寫Prompt的Claude 3 Opus,如今也灰頭土臉地墜落至第139名。
在這個修羅場上,沒有任何一個LLM能坐穩王座。
或許昨日還是遙遙領先,轉眼就變成了無人問津。
一個令人背后發涼的事實浮出水面:不僅是人類跟不上AI,現在連AI都要跟不上AI了。
進化成「果蠅」:大模型王座的35天生死線
或許你不愿承認,但實際上我們引以為傲的「技術壁壘」,保質期平均只有35天。
這意味著當你為當下的SOTA歡呼時,它的生命也開始了倒計時。
擱在以前,軟件行業那是「大象漫步」。Windows幾年憋個大招,iOS一年擠一次牙膏。
那時候,我們有大把的時間去學習文檔、去適配接口、去像模像樣地挖一條「護城河」。
但現在?對不起,時代變了。AI模型的生命周期,已經突變為了「果蠅」。
![]()
果蠅的生命周期短,且繁殖能力強,能在短時間內迅速增加種群數量。并且對環境的適應能力很強,在不同類型的環境中都能生存和繁殖
這種生物學級別的瘋狂迭代,催生出一種極度反直覺的恐怖現象——「技術倒灌」。
以前是產品等技術,現在是技術追著產品殺。
數據顯示,一個模型登頂后,保鮮期甚至不如一盒鮮牛奶。僅需5個月,它就會被踢出Top5;到了第7個月,它甚至連Top10的入場券都拿不到。
這不僅僅是排名的更替,這是對產品經理和開發者的降維打擊。
試想一下,你是一個雄心勃勃的創業者,發現了一個絕佳的痛點。你拉融資、組團隊、寫代碼、調Prompt,甚至連發布會的PPT都做好了。
整個流程跑完,耗時3個月,夠快了吧?
但就在你準備按下「發布」鍵的前夜,OpenAI或Google突然開了一場發布會。
然后你會崩潰地發現:你辛苦研發了90天的核心功能,被新模型直接「原生內置」了。
原本也是個獨角獸苗子,因為基座能力的代差,一夜之間變成了沒人要的「套殼玩具」。
你的產品還沒來得及出道,就已經原地宣布退役。
這就是「果蠅時代」的生存悖論:你在流沙上蓋樓,而流沙流動的速度,比你砌磚的手速還要快。
你的研發速度,跑不過基座的「保質期」
這徹底顛覆了過去十年的互聯網鐵律。以前是淘寶雙11逼出了阿里云,是微信流量逼出了分布式架構——那是「應用倒逼基建」的黃金時代。
但在2026年的今天,劇情迎來大反轉。
基礎設施在瘋狂變異,而應用層跟不上節奏只能被無情碾碎。
看看Claude 3 Opus的下場吧。為了適配它,無數工程師熬夜寫下的數萬行復雜代碼,在官方的一紙公告下,瞬間變成了一堆毫無價值的「賽博垃圾」。
![]()
Claude 3 Opus已于2026年1月5日正式退役,Anthropic在2025年6月30日通知開發者。這意味著任何直接調用Claude 3 Opus的API代碼將失效,需要遷移到新模型。
未來,這樣的場景可能會經常發生。
你拿來融資兩輪的「護城河」,可能只是大廠更新日志里的一行小字。
你還在沾沾自喜優化了響應速度,讓用戶覺得「不卡」;結果新一代開源模型直接把延遲壓縮到了1.5秒。
用戶拋棄你的時候,連一聲「再見」都不會說,因為你的產品在他們眼里,就像是還在用2G網的老年機——又笨又慢
![]()
當基座模型的進化速度(ΔModel)遠大于你的產品迭代速度(ΔProduct)時,所有的產品經理都陷入了一種荒謬的境地:
你在刻舟求劍,但那條河不僅改道了,甚至可能已經干涸了。
無數創業公司,就這樣死在了「版本更新」的路上,尸骨未寒。
![]()
Windsurf的CEO表示,Anthropic的變動沒有提前通知該公司,現在該初創企業必須尋求其他第三方計算提供商。
![]()
那些曾經火遍全網的PDF總結工具、AI翻譯插件、簡單的Agent智能體……只是因為跑得不夠快,被身后突然加速的巨輪直接碾過去了。
拒絕冰上雕花:別在「果蠅」的生命周期里建高樓
時至今日,我們必承認一個殘酷的現實:在這個技術大爆炸的特定階段,盲目的「長期主義」,可能就是最致命的毒藥。
我們曾以為掌握了Prompt Engineering就是掌握了魔法。但在o1這種自帶強化學習的模型面前,這些技巧瞬間淪為笑話。
這就是「果蠅時代」最冷酷的啟示:所有依附于「模型缺陷」而存在的技能和產品,本質上都是一次性的耗材。
就像是在冰塊上雕花,無論你雕得多么精美,太陽升起后,一切歸零。
未來的生存法則,將被撕裂向兩個極端:
要么,做極度輕量化的「游擊隊」。像搭積木一樣快速組裝,快速驗證,賺一波快錢,在35天的窗口期關閉前撤退。
![]()
Builder.ai,靠「AI助理Natasha」快速吸金,但本質是人類+AI混合,hype期賺快錢后2025年破產關門
要么,徹底放棄對「模型智商」的迷戀,轉而去挖掘那些「模型永遠無法碾壓」的東西——私有的數據、復雜的物理場景、以及人與人之間那些微妙且無法被量化的信任。
除此以外,所有試圖在中間地帶「歲月靜好」的,皆是墳墓。
![]()
看著榜單上那些陌生的新名字,別再在那塊注定會融化的冰上雕花了。
如果不能在流沙上起舞,那就快跑。
跑向數據,跑向場景,跑向那些AI暫時還觸達不到的真實世界。
參考資料:
https://x.com/xiaohu/status/2010620356793622654
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.