★ 設(shè)為星標(biāo) | 只講人話,帶你玩轉(zhuǎn)AIGC。
太卷了,真的太卷了。
Google 的 Gemini 3 Pro 才發(fā)布不到一周吧?
“最強(qiáng)模型”的屁股還沒坐熱,今早一睜眼,Anthropic 反手就是一個王炸:Claude Opus 4.5 來了。
這就是神仙打架,凡人看戲。
![]()
圖:美國 AI 競爭循環(huán)
本來Gemini 3 Pro 的編碼能力就不如 Claude,這回更是被甩了一條街。
![]()
圖:Opus 4.5 性能指標(biāo)
廢話不說,看看它到底強(qiáng)在哪。
1. 代碼能力封神:這回是真“大佬”
這次最嚇人的還是寫代碼。
在權(quán)威的軟件工程測試 SWE-Bench 里,它拿了 80.9%,直接甩飛友商。
![]()
圖:軟件工程能力對比
更離譜的是,Anthropic 透露:在內(nèi)部高難度招聘測試?yán)铮牡梅殖^了所有人類候選人。
不過這里有個細(xì)節(jié)。
這個“超越全人類”的成績是開了個“外掛”跑出來的——同時試好幾種解法挑最好的。
如果關(guān)掉外掛,它的成績是追平了最強(qiáng)人類。
但哪怕是“追平”,也夠恐怖了,程序員這回真的。。。得想想新的職業(yè)了?
2. 價格膝蓋斬:頂級大腦“白菜價”
通常來說,性能越強(qiáng)越貴,但這次 Claude 居然反向操作。
Opus 4.5 的價格,直接比上一代砍掉了三分之二。
![]()
圖:Claude 模型價格對比
立刻能用的神器
除了這些,他們還提供了一些工具,我們可以直接用起來:
- Claude for Chrome: 瀏覽器裝個大腦,跨標(biāo)簽頁自動整理信息,搬磚神器。
- Claude for Excel: 別背公式了,直接跟它說人話,表格自動搞定。
Claude 寫代碼最強(qiáng)其實(shí)早就不算新聞了,但這周的劇情真的太精彩。
前兩天 Gemini 3 Pro 剛發(fā)布時,那種“手搓代碼”的演示已經(jīng)讓無數(shù)人直呼“天花板”了。
結(jié)果呢?Anthropic 連一周的安全期都沒給對手留,反手就用 Opus 4.5 再次刷新了認(rèn)知。
巨頭們卷得越兇,留給我們的工具就越強(qiáng)。
評論區(qū)聊聊,在這個“代碼大爆炸”的時代,你最看好誰?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.