![]()
新智元報道
編輯:犀牛
【新智元導讀】OpenRouter突然上線匿名隱身模型Pony Alpha:幾句簡介、一個藍色Logo,卻憑離譜的編程、推理與200K上下文體驗把外網點燃。更戲劇的是,全球立刻開啟「猜爹大賽」——Claude、DeepSeek、Grok、GLM各派開吵,也讓「匿名盲測式發(fā)布」這種新打法浮出水面。
2月7日深夜,全球最大的模型服務平臺OpenRouter悄悄上線了一個匿名模型,代號:Pony Alpha。
沒有官宣,沒有發(fā)布會,沒有鋪天蓋地的營銷通稿——只有一個藍色的Logo、一行簡短的介紹,和一個讓所有試用者集體失語的體驗。
然后,整個外網就瘋了。
一匹來歷不明的「黑馬」
事情的起因很簡單。
OpenRouter官方發(fā)了一條推文,語氣云淡風輕:「我們上線了一個新的隱身模型Pony Alpha。它是新一代基礎模型,在編程、推理和角色扮演方面表現強勁,并針對Agent工作流做了優(yōu)化,工具調用準確率極高。」
![]()
就這么幾句話,連誰做的都沒提。
但問題是——這玩意兒太強了。
有人半夜睡不著,隨手把一段改了一天都沒搞定的屎山代碼扔進去,結果Pony Alpha不僅精準定位了邏輯漏洞,還順手把后端架構重構了一遍。
有人用一句話提示詞,讓它生成了一個包含35個全球電臺的收音機網頁應用,動畫UI流暢,代碼超過500行,全部塞在一個文件里。
![]()
還有人讓它一個提示詞做出了一款90年代復古風格的足球小游戲,完成度高到令人懷疑人生。
![]()
用一位網友的話說:「邏輯密度極高,完全沒有幻覺廢話。」
這種體驗,在當前的大模型江湖里,不是隨便哪個選手能給的。
于是,一場全球規(guī)模的「猜爹大賽」正式拉開帷幕。
全網競猜
這匹Pony到底姓什么?
外網技術圈的偵探本能被瞬間點燃。有人翻模型參數,有人對比輸出風格,有人逐字分析回復中的措辭習慣,試圖從蛛絲馬跡中還原它的真實身份。
第一陣營:Claude派。
不少開發(fā)者試用后的第一反應是「這體感太像Claude了」。
有人注意到Pony Alpha在光照處理上使用了ACES色調映射——這恰恰是Claude系列模型的標志性偏好。
更有甚者,直接逼問模型「你到底是誰」,結果Pony Alpha在推理過程中承認自己「是Claude,由Anthropic開發(fā)」。
知名開發(fā)者Sami Hindi在X上驚呼:「Pony Alpha is an Anthropic model??」
連ChatGPT都被拉來當裁判,給出的判斷是:這大概率是Claude Sonnet 5。
![]()
第二陣營:DeepSeek派。
Replit的CEO Amjad Masad則另有判斷。
他注意到上線時間恰逢中國農歷新年前后,推測這可能是DeepSeek的新版本。畢竟DeepSeek-V3此前的表現已經讓全球側目,一個更強的V4版本出現在匿名測試平臺上,邏輯完全說得通。
第三陣營:Grok派。
Abacus.AI的CEO Bindu Reddy則把票投給了xAI。
她的理由是Pony Alpha強調角色扮演能力,這和Grok系列的定位高度吻合,再加上xAI剛剛并入SpaceX,推出Grok 4.2的時間窗口也對得上。
第四陣營:GLM派。
也許是最具戲劇性的一個猜測。
有人直接問Pony Alpha「你是什么模型」,它回答:「I'm GLM, a large language model developed by Z.ai。」
這個回答讓Reddit上的討論區(qū)瞬間沸騰。
知名博主karminski-牙醫(yī)也公開猜測,Pony Alpha要么是DeepSeek-V4,要么就是GLM的新模型。
![]()
四大陣營各執(zhí)一詞,吵得不可開交。這大概是AI圈今年開年以來最熱鬧的一場辯論。
線索拼圖
200K上下文與馬年的暗示
拋開主觀體感,我們來看看硬參數能告訴我們什么。
根據OpenRouter頁面顯示,Pony Alpha支持推理能力,擁有200K的上下文窗口,最大輸出131K token,延遲約6.64秒,吞吐量21tps。
這些數字本身就很能說明問題——200K的上下文長度,在目前公開的模型中并不多見,恰好與Claude Sonnet系列和部分國產頂級模型的參數對得上。
但最耐人尋味的,是「Pony」這個名字本身。
2026年,農歷馬年。Pony,小馬。如果這是一個來自中國的模型團隊命名的,這個巧思幾乎是明牌。而如果進一步聯想——中國科技圈里,有一位以Pony聞名的人物,雖然他的公司目前并不以大模型聞名,但誰知道呢?正如一位網友的神評論:「看到名字叫Pony……該不會是……騰訊的吧?」
當然,這或許只是巧合。但在AI圈,巧合往往是最好的營銷。
匿名測試
一種正在流行的發(fā)布策略
Pony Alpha事件的有趣之處,不僅在于模型本身的實力,更在于它揭示了一種正在成為主流的模型發(fā)布策略:匿名盲測。
過去,大模型的發(fā)布遵循的是傳統科技公司的路徑——開發(fā)布會、發(fā)論文、上榜單、刷跑分。
但這套玩法正在失效。當每家公司都說自己SOTA,當每個榜單都被質疑「刷分過擬合」,用戶的信任成本越來越高。
匿名盲測提供了一種截然不同的信任建立方式:不告訴你我是誰,你先用,用完了覺得好,再揭曉身份。這本質上是把評判權交還給了用戶,用真實體驗替代了PR話術。
Pony Alpha的爆火恰恰證明了這一點。
它沒有跑分數據,沒有技術白皮書,沒有任何品牌背書,僅憑裸體驗就在全球開發(fā)者社區(qū)掀起了一場狂歡。
這種用實力制造懸念的打法,比任何發(fā)布會都高明。
如果是國產
那才是真正的炸裂
回到最核心的問題:Pony Alpha到底是誰?
截至目前,官方沒有給出任何確認。
但綜合各方線索——模型自述為GLM、馬年命名暗示、與中國春節(jié)時間節(jié)點的高度吻合、以及部分網友通過技術手段發(fā)現的中國模型特征——國產模型的可能性確實不小。
![]()
如果Pony Alpha最終被證實是一個來自中國的模型,這件事的意義將遠超模型本身。
它意味著國產大模型已經不再需要通過「對標GPT-4、趕超Claude」這種敘事來證明自己,而是可以匿名走上全球舞臺,讓全世界的開發(fā)者在不知情的情況下為之驚嘆。
這才是真正的實力證明——不靠標簽,不靠敘事,只靠體驗本身。
正如那位小紅書網友寫的那樣:「有路子野的兄弟知道內幕嗎?如果是國產我直接吹爆。」
我想,這也是此刻無數人心底的聲音。
謎底揭曉的那一天,也許比我們想象的更近。
而不管Pony Alpha最終姓甚名誰,它已經用一種最酷的方式證明了一件事:在2026年的AI戰(zhàn)場上,最好的發(fā)布會,就是不開發(fā)布會。
參考資料:
https://openrouter.ai/openrouter/pony-alpha
https://x.com/zakarinoo7/status/2020306074377822703
https://x.com/karminski3/status/2020006334041862296
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.