Anthropic 急了,發布了 Claude Opus 4.5,同時終于從原來死貴的 75 美元變成了 25 美元,當然還是比 Gemini 3 Pro 貴不少。
介紹一下詳細更新內容:
## 性能表現:編程任務新世界第一
SWE-bench Verified Opus 4.5 拿了第一。
Anthropic 內部還做了個有意思的測試:他們讓 Opus 4.5 做性能工程師的入職考試(2小時限時),結果模型的分數超過了所有人類候選人。
不只是編程,Opus 4.5 在數學、視覺、推理等各個維度都有提升。
## 頂級模型價格對比(per million tokens):
- Claude Opus 4.5: $5 / $25
- GPT-5.1: $1.25 / $10
- GPT-5-pro: $15 / $120
- Gemini 3 Pro: $2-4 / $12-18
## 效率大幅提升:更聰明意味著更省錢
Opus 4.5 引入了一個新參數叫 effort(努力程度),你可以根據任務選擇不同的思考深度。
在 medium effort 模式下,Opus 4.5 達到了 Sonnet 4.5 的最佳分數,但只用了 24% 的輸出 tokens。換句話說,少用了 76% 的 tokens。
即使在 highest effort 模式下,Opus 4.5 的表現超過 Sonnet 4.5 有 4.3 個百分點,同時還少用了 48% 的 tokens。
這說明模型變聰明了:更少的回溯、更少的冗余探索、更精準的推理。對于長期運行的代理任務,這個效率提升會直接轉化為成本節省。
有權使用 Opus 4.5 的 Claude 和 Claude Code 用戶,已移除針對 Opus 的特定限制。
Max 和 Team Premium 用戶,提高了總體使用上限,這意味著將擁有與之前使用 Sonnet 時大致相同數量的 Opus Token。
效率提升這點是這次比較關鍵的,用的好的話,它可能會比 sonnet 4.5 還要便宜。
我的觀察是它有點變得像GPT5.1了。 就是輸出的結果和思考的結果非常的節省。然后輸出的結果就我能看懂,但是它不像是給人看的,寫出來。
![]()
![]()
![]()
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.