前兩天Opus 4.6和GPT-5.3-Codex才剛出。
我已經(jīng)連夜做了不少測(cè)試,尤其是發(fā)現(xiàn)Opus4.6+Agent Teams模式不錯(cuò),我花了不到1小時(shí)就搞出個(gè)網(wǎng)頁版的紅白機(jī)游戲廳網(wǎng)站,100多款瀏覽器里直接玩。
實(shí)測(cè)Claude最新的Agent Teams,3個(gè)AI隊(duì)友45分鐘給我整了個(gè)紅白機(jī)游戲廳
結(jié)果昨天文章剛寫完還熱乎著,又在X上刷到OpenRouter上出了個(gè)代號(hào)「Pony Alpha」的神秘模型,沒標(biāo)注來源,但好幾個(gè)開發(fā)者評(píng)價(jià)都挺高的。有人猜是DeepSeek V4,也有人說像GLM-5,或者Sonnet 4.6的變體。
我算是搞明白了,這個(gè)春節(jié)別想歇著了,會(huì)被各種大模型發(fā)布卷死...
我倒是正好想把這個(gè)紅白機(jī)游戲網(wǎng)站搞成app版本的,正好裝載手機(jī)里,回家坐飛機(jī)沒網(wǎng)的時(shí)候也能掏出手機(jī)來兩局。
所以我把OpenRouter上的這個(gè)Pony模型接進(jìn)Claude Code了,把網(wǎng)頁版項(xiàng)目整個(gè)丟給它——重構(gòu)成iOS原生App,離線運(yùn)行,游戲和封面全部打包進(jìn)去。
這個(gè)任務(wù)其實(shí)不簡(jiǎn)單。網(wǎng)頁版4700多行代碼,要變成iOS App等于推倒重來。模擬器核心要換方案,觸屏操控得重寫,133款游戲的ROM和封面要做本地資源管理,UI也得從HTML全部換成SwiftUI。
完全是個(gè)大型重構(gòu)項(xiàng)目了...
這個(gè)重構(gòu)項(xiàng)目最后跑下來發(fā)現(xiàn)比網(wǎng)頁版復(fù)雜不少,耗時(shí)大概2小時(shí),寫了一大堆我看不懂的c代碼(圖4)。
不過整個(gè)過程中我基本就接入了5、6次,這個(gè)模型自己能拆任務(wù),自己選了模擬器方案,每次基本上跑個(gè)10-20分鐘才需要我看一眼的。最后成品結(jié)果可以看圖5圖6,基本和我網(wǎng)站的樣式(圖3)類似,我還挺驚喜的,沒想到這么順利。
這個(gè)模型體感上邏輯很緊,規(guī)劃能力有點(diǎn)像Opus的那種思路,但又不完全一樣。不像是一個(gè)只會(huì)搓前端頁面的模型能干出來的活。如果是 Deepseek V4 的話,這個(gè)能力很強(qiáng)啊,完全媲美海外一線的模型。頓時(shí)有點(diǎn)期待它正式官宣的時(shí)候了。
不管是哪家的,過年前還整這出,估計(jì)這春節(jié)又沒法安心過了。
馬年取Pony這么個(gè)名字,我估計(jì)還是國(guó)內(nèi)大模型的概率高。究竟是DeepSeek V4,還是GLM-5呢,反正這一波測(cè)下來我都挺期待的。
又或者,這個(gè)Pony,不會(huì)是在暗示是...Pony Ma(馬化騰)吧???難道是姚順雨入主騰訊AI之后,整出的第一個(gè)開源模型?
咱們玩?zhèn)€競(jìng)猜吧,48小時(shí)內(nèi)在評(píng)論區(qū)留下你的猜測(cè),猜對(duì)的人里,獲得點(diǎn)贊數(shù)最多的評(píng)論,花叔會(huì)給你發(fā)個(gè)200塊的新春紅包
![]()
![]()
![]()
![]()
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.