美國人工智能公司 Anthropic 宣布推出中型模型 Sonnet 的最新版本 Sonnet 4.6,繼續保持公司每四個月一次的迭代節奏。 官方表示,新版本在代碼編寫、指令遵循以及計算機操作等方面均有明顯提升。 Sonnet 4.6 將立即成為免費和付費 Pro 用戶的默認模型。
![]()
此次發布的測試版 Sonnet 4.6 將支持多達 100 萬 token 的上下文窗口,是此前 Sonnet 系列可用最大上下文的兩倍。 Anthropic 將這一容量描述為“足以在單次請求中容納整套代碼庫、冗長合同或數十篇研究論文”。 更大的上下文意味著模型在處理復雜工程項目、法律文本和學術資料時,能夠在一次對話中保留更多關鍵信息。
![]()
Sonnet 4.6 的推出距離高端模型 Opus 4.6 上線僅過去兩周,業內預計體量更小的 Haiku 模型也將在未來數周迎來更新。 這表明 Anthropic 正在圍繞不同尺寸模型維持一個緊湊的產品升級節奏,以覆蓋從輕量到旗艦的多種使用場景。
在性能方面,Anthropic 稱 Sonnet 4.6 刷新了多項基準測試記錄,其中包括衡量計算機操作能力的 OS World,以及衡量軟件工程能力的 SWE-Bench。 更引人矚目的是,Sonnet 4.6 在用于評估“類人智能”能力的 ARC-AGI-2 測試中取得 60.4% 的成績。 這一分數使 Sonnet 4.6 超過了大多數同級別模型,但在整體表現上仍落后于 Opus 4.6、Gemini 3 Deep Think 以及經精調的 GPT 5.2 等高端模型。
![]()
從產品策略看,Anthropic 正試圖通過在中端價位段持續強化 Sonnet 系列,來鞏固其在通用 AI 辦公、軟件開發與長文本處理等領域的競爭力。 隨著上下文窗口翻倍和推理能力增強,Sonnet 4.6 有望進一步吸引需要處理大型代碼倉庫和復雜業務文檔的企業與開發者用戶。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.