![]()
大數據文摘出品
8月6日,也就是今天,Anthropic正式推出了其旗艦模型Claude Opus 4.1,對Opus 4進行全面升級。
![]()
Claude Opus 4.1目前已上線于Claude的付費服務、Claude Code平臺、API接口、Amazon Bedrock,以及Google Cloud的Vertex AI。
價格維持不變,還是那個會員價。
![]()
該版本最引人注目的是在SWE-bench Verified基準測試中拿下了74.5%的得分,打破了此前記錄。這是測試衡量的是AI模型在開源代碼中的實際Bug修復能力。
![]()
圖片來源:Anthropic
Opus 4.1的得分比前代Opus 4高出約兩個百分點,領先OpenAI最新的o系列模型約五個百分點。
GitHub方面指出,Claude Opus 4.1在多文件代碼重構方面表現尤為突出,幾乎所有指標相較于Opus 4均有提升。
Rakuten Group提供了實戰數據:該模型能在龐大代碼庫中精準識別問題位置,避免不必要的修改,也不會引入新Bug。
這種“只動該動的地方”的風格,恰恰適合日常調試。
曾專注AI編程的創業公司Windsurf稱,Claude Opus 4.1在其“初級開發者測試”中取得了一整標準差的提升。他們把這種飛躍比作Sonnet 3.7升級到Sonnet 4時的表現差距。
也就是說,對一線開發者而言,這不是微調,而是質變。
01 更聰明的“AI agent”
除了編程能力之外,Claude Opus 4.1在數據分析和研究任務中的能力也大幅增強。
Anthropic表示,模型在細節跟蹤與**任務搜索(agentic search)**方面變得更加可靠。
agentic能力指的是AI能否獨立完成多步驟、目標明確的復雜任務。
這類能力越來越成為AI競賽的主戰場。
Opus 4.1在這方面已經顯現出對比其他主流模型的領先優勢。
在Anthropic公布的基準測試中,Opus 4.1在agentic編碼、視覺推理、數學競賽任務上,全面超越Sonnet 4、Gemini 2.5 Pro以及OpenAI的o3版本。
![]()
Claude Opus 4.1 在代理式編程、視覺推理和數學競賽等領域略勝其他領先的 AI 模型一籌。| 圖片來源:Anthropic
Claude官方建議所有使用Opus 4的用戶盡快遷移到Opus 4.1。如果是API用戶,只需要更換模型tag為claude-opus-4-1-20250805即可接入。
整個遷移過程無縫銜接。
02 正面迎戰GPT-5
Claude Opus 4.1的發布時間并不巧合。OpenAI的下一代重量級模型GPT-5即將發布。(有消息稱是本周四)
據《The Information》報道,GPT-5的改進集中于編程、數學和代理任務,但不會像GPT-3到GPT-4那樣帶來“斷層式”進化。
換言之,GPT-5很強,但不會一騎絕塵。
Anthropic的動作就是在這個時間點,推出Opus 4.1,并公開承諾:更大幅度的模型升級將在“未來幾周內”陸續上線。這既是回應,也是挑釁。
他們顯然意識到,如果GPT-5僅有“漸進式提升”,那么Claude 4.1就是一個可以維持技術制高點的“緩沖帶”。
對開發者來說,這意味著無需觀望GPT-5,Claude已經足夠先進,值得繼續押注。
顯然,這是Anthropic“為GPT-5發布預先埋下的棋子”。而且棋下得很準。
同時,他們鼓勵開發者閱讀系統卡(System Card)、模型頁面、價格頁和技術文檔,全面了解Opus 4.1的全貌。
作者長期關注 AI 產業與學術,歡迎對這些方向感興趣的朋友添加微信Q1yezi,共同交流行業動態與技術趨勢!
GPU 訓練特惠!
H100/H200 GPU算力按秒計費,平均節省開支30%以上!
掃碼了解詳情?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.