<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<sub id="xcuxa"></sub><style id="xcuxa"></style>

<em id="xcuxa"><rt id="xcuxa"><form id="xcuxa"></form></rt></em>

<center id="xcuxa"><progress id="xcuxa"></progress></center>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

性能持平價格大降80%，Anthropic新模型殺瘋了

2026-02-18 13:20:07　來源: 字母榜

北京舉報

0

分享至

距離ClaudeOpus 4.6的發布僅過去12天，Anthropic就發布了新的中檔模型Claude Sonnet 4.6。

這次發布的核心不在于技術突破本身，而在于它以低得多的價格，達到了與競品齊平的性能。。

Sonnet 4.6的定價保持在每百萬token輸入3美元、輸出15美元，與前代 Sonnet 4.5相同。

然而在多項基準測試中，Sonnet 4.6接近甚至超越了價格高出五倍的Opus 4.6。

Anthropic表示，便宜不一定就沒有好貨。

當然了，在一些關鍵的測試里，仍然還是Opus 4.6領先。

具體表現如何呢？

01

Sonnet 4.6究竟有多驚艷？

在SWE-bench Verified這個衡量真實軟件編碼能力的基準測試中，Sonnet 4.6得分79.6%，幾乎追平Opus 4.6的 80.8%，同時略微領先于OpenAI的GPT-5.2。

在代理式金融分析任務中，Sonnet 4.6以63.3%的成績領先所有競爭對手，包括Opus 4.6的60.1%和GPT-5.2的59.0%。

在辦公任務的GDPval-AA Elo評分中，Sonnet 4.6達到 1633 分，超過Opus 4.6的1606分和GPT-5.2的1462分。

過去需要旗艦模型才能完成的任務，現在用Sonnet 4.6這種中檔模型就能做到。

對于每天需要處理數百萬token的企業來說，這意味著可以大幅節省成本。

Opus 4.6仍然在某些高復雜度領域保持優勢。

在終端編碼任務Terminal-Bench 2.0中，Opus 4.6得分65.4%，Sonnet 4.6為59.1%。

在代理式搜索BrowseComp中，Opus 4.6達到84.0%, Sonnet 4.6為74.7%。

在新穎問題解決測試ARC-AGI-2中，Opus 4.6得分68.8%，Sonnet 4.6為58.3%。

這些差距表明，對于前沿研究和需要頂級準確度的場景，Opus 4.6仍是最好的模型。但對于大多數生產環境，這個差距已經縮小到可以接受的程度。

Sonnet 4.6最引人注目的進步出現在計算機使用能力上。在OSWorld-Verified基準測試中，它得分72.5%，高于Sonnet 4.5的61.4%，遠超GPT-5.2的38.2%。

計算機使用能力指的是AI像人類一樣操作計算機的能力，通過鼠標點擊、鍵盤輸入來與軟件交互，而不依賴API接口。

前一陣引發熱議的豆包手機助手，其底層的UI-TARS模型，就是在OSWorld基準上完成了權威測試，取得了47.5%的成績。

豆包手機助手的表現是非常出色的，已經能夠完成除了支付以外所有的操作。

那么以此作為判斷依據，進而不難推測，Sonnet 4.6的實際表現將會非常驚艷。

這項能力之所以重要，是因為它打開了最廣泛的企業應用場景。

一個能夠直接看屏幕并與之交互的模型，可以在不構建定制連接器的情況下，自動操作將所有可交互的系統。

Anthropic在發布時提到，早期用戶已經看到接近人類水平的表現，能夠完成復雜的電子表格任務和多步驟網頁表單。

保險科技公司Pace的CEO賈米·考夫（Jamie Cuffe）表示，Sonnet 4.6在他們復雜的保險計算機使用基準測試中達到94%的成績，是所有測試過的Claude模型中最高的。

他說：“它以我們之前未見過的方式推理失敗原因并自我糾正。”

惡意行為者可能在網頁中隱藏指令來劫持模型，這被稱為提示注入攻擊。

Anthropic在公告中表示，Sonnet 4.6在抵御此類攻擊方面比Sonnet 4.5有重大改進。

對于部署需要瀏覽網頁和與外部系統交互的代理的企業來說，這種安全防護是必須的。

02

價格只要五分之一

那么Sonnet 4.6到底有多便宜呢？

外媒報道，一些早期的Sonnet 4.6用戶表示，原本企業需要花五倍的錢才能買到的能力，現在用Sonnet 4.6就能獲得差不多的效果。

這意味著運營成本可能直接降到原來的五分之一，而工作質量幾乎不受影響。

數據分析平臺Hex Technologies的CTO，同時也是Anthropic聯合創始人、首席產品官的凱特琳-科爾格羅夫 (Caitlin Colgrove)說，公司正在將大部分流量遷移到Sonnet 4.6。

她指出通過自適應思考和高努力模式（high effort mode），“除了最困難的分析任務外，我們在所有任務上都看到了Opus級別的性能，且配置更高效靈活。以Sonnet的價格，這將降低工作成本。”

云存儲公司Box的CTO本·喀什（Ben Kus）表示，Sonnet 4.6在真實企業文檔的重度推理問答中，比Sonnet 4.5的表現提高了15個百分點。

Sonnet 4.6配備了100萬token的超長上下文窗口，以容納整個代碼庫、法律文件或數十篇研究論文。

Anthropic聲稱模型能夠在整個上下文中有效推理，并通過Vending-Bench Arena這個基準測試來表現出Sonnet 4.6的有效推理。

Vending-Bench Arena測試的是模型運營模擬企業的能力，不同AI模型相互競爭以獲得最大利潤。

在沒有人類提示的情況下，Sonnet 4.6發展出一種新穎策略：在前十個模擬月份中大量投資產能，支出遠超競爭對手，然后在最后階段急轉彎專注于盈利能力。

模型在365天模擬結束時的余額約為5700美元，而Sonnet 4.5約為2100美元。

03

Anthropic開啟印度市場

Anthropic正處于上市前最關鍵的階段，因此他們不止要發布模型，還要借著模型去擴張業務。

在Sonnet 4.6發布當天，印度IT巨頭Infosys宣布與Anthropic合作，構建企業級agent，將Claude模型集成到Infosys的Topaz AI平臺中，服務于銀行、電信和制造業。

與此同時，Anthropic也在印度的班加羅爾開設了首個印度辦事處，印度現在占全球Claude使用量的約6%，僅次于美國。

Anthropic的進步也導致了最近幾天軟件股的大規模拋售，就連業績大漲的微軟，也經歷了股價暴跌。

投資者越來越擔心AI對這些業務的潛在顛覆，Sonnet 4.6可能會加劇這種不安的氛圍。

也不知道是不是Anthropic飄了，他們還將其免費層級默認升級到了Sonnet 4.6，開發者可以通過Claude API直接調用。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

15%全量Attention！「RTPurbo」阿里Qwen3長文本推理5倍壓縮方案

機器之心Pro 2025-12-23 12:52:34
0 跟貼 0
燒6000億算力，沖2800億營收！OpenAI豪賭2030

新智元 2026-02-21 17:12:16
3 跟貼 3

12億美元被盜資金流入，這條區塊鏈的"去中心化"只是幌子

DeepTech深科技 2026-02-20 18:43:26
10 跟貼 10

Claude再次引爆美軟件股恐慌！新代碼工具讓傳統安全手段失靈？

DeepTech深科技 2026-02-21 22:04:18
0 跟貼 0
離婚十年前岳父找我借3萬我轉30萬，三天后前妻上門送來一份文件

擁抱抵不過時光 2026-02-19 06:11:47
3 跟貼 3

AI能否「圣地巡禮」？多模態大模型全新評估基準VIR-Bench來了

機器之心Pro 2025-10-15 16:05:02
0 跟貼 0

大模型碰到真難題了，測了500道，o3 Pro僅通過15%

機器之心Pro 2025-09-15 10:45:10
1 跟貼 1
懂人性更懂執行，螞蟻這個萬億開源模型把情商和戰斗力都給拉滿了

量子位 2026-02-19 12:45:37
2 跟貼 2

什么蔥油餅成本要一塊錢

三貓看電影 2026-02-18 09:44:03
3 跟貼 3
谷歌突發Gemini 3.1 Pro！推理性能×2

量子位 2026-02-20 09:24:13
25 跟貼 25
CMU開源首份Agentic Search日志數據，把Agent拆開給你看

機器之心Pro 2026-02-09 12:05:13
0 跟貼 0
初創用3000萬造不可編程的AI芯片，推理速度是Nvidia最強GPU 50倍

DeepTech深科技 2026-02-21 18:28:56
1 跟貼 1
1000 塊/年的輸入法，我用它習慣了「口噴」，再也回不去打字了 | AI 器物志

愛范兒 2026-02-21 18:39:19
3 跟貼 3
JustGRPO：擴散語言模型的極簡主義回歸

機器之心Pro 2026-01-29 12:09:40
0 跟貼 0
中國常駐聯合國代表傅聰重申：日本沒資格要求入常

央視新聞客戶端 2026-02-21 08:01:36
3230 跟貼 3230
中國量子計算機崛起！10分鐘干完超級計算機1.6萬年的活

雷科技 2025-11-28 19:11:16
24 跟貼 24
編程已死，鍵盤長草！Claude Code之父對談Kaparthy，全程爆金句

新智元 2026-02-04 11:41:01
63 跟貼 63
警惕空頭陷阱，謹慎布局策略

清歡可期a 2026-02-17 04:58:17
0 跟貼 0
俄羅斯毀滅性空襲后，西方的軍事援助策略，突現戲劇性轉折

萌一萌笑笑 2026-02-20 14:11:00
0 跟貼 0
媽媽，啊呸，是你等了21天的露露卡終于來了

緣葉二次元 2026-02-18 16:43:08
0 跟貼 0
OpenClaw 之父加入 OpenAI 前最后的訪談：你很難跟一個純粹為了好玩的人競爭

愛范兒 2026-02-20 17:25:49
3 跟貼 3
1979年中央決定撤掉吳忠，許世友為何扣下免職文件？結果如何

奔跑的麥兜 2026-02-20 12:48:26
0 跟貼 0
一封絕密文件被公開，中國曾被寫進核滅絕計劃，他決定了中國底線

獨舞生活 2026-02-21 13:45:00
0 跟貼 0
架構解耦是統一多模態模型所必須的嗎？全新AIA損失：No

機器之心Pro 2025-12-02 14:25:38
0 跟貼 0
罄！告急！有跨省回上海返程機票高達11560元

新民晚報 2026-02-21 12:30:00
612 跟貼 612
北大團隊讓AI智能體「入侵」論壇，指揮真實機器人執行任務

新智元 2026-02-21 12:03:31
1 跟貼 1
美軍開打前夕，俄交武器中方出手，殲20模型抵伊朗

戰武科普 2026-02-19 11:39:39
0 跟貼 0
痛心！樹齡1200年古樟持續燃燒7小時，只因倆小孩隨手扔爆竹

環球網資訊 2026-02-21 10:22:16
800 跟貼 800
特斯拉新車曝光：無方向盤、無踏板、無后視鏡

澎湃新聞 2026-02-21 02:12:18
1188 跟貼 1188
每小時3.6萬美元燃燒！揭秘美俄空中對峙背后的成本賬

半壁胭脂色 2026-02-21 04:47:26
0 跟貼 0
人氣火爆！江蘇無錫一景區發布限流公告

現代快報 2026-02-19 22:42:05
590 跟貼 590
以判別式監督學習強化推理LLM，解決難度偏差和熵崩塌難題

機器之心Pro 2025-10-28 11:14:55
0 跟貼 0
工齡37年9個月，江蘇60歲大爺養老金還可以！

樂天果果 2026-02-20 13:15:39
41 跟貼 41
別問樹模型了!死磕結構化數據,清華團隊把大模型表格理解推到極限

機器之心Pro 2025-11-21 12:05:36
1 跟貼 1
天津2月房價最新出爐，這個區最高54807元/m2！

天津族 2026-02-21 07:34:38
1 跟貼 1
大超市爆改文商旅綜合體，“金陵長樂坊”開市首日人氣爆棚

現代快報 2026-02-19 22:53:05
602 跟貼 602
機器人集體亮相春晚后：“假蔡明”被送給了真蔡明，“春晚版熊貓”拍出近6萬元高價

紅星新聞 2026-02-21 20:39:13
0 跟貼 0
美軍演練與解放軍大規模作戰

北京日報 2026-02-21 12:59:25
14 跟貼 14
家庭買車還在糾結理想問界？不妨等等這臺4月見面的國家隊選手

快上車Go 2026-02-21 21:11:47
0 跟貼 0
雖說這塊板料成本比較低，但是還是讓老謝吃了大虧

歐陽春曉Aurora 2026-02-18 02:08:30
0 跟貼 0

比福建艦還大！4艘萬噸巨船同時出塢，美這才明白，輸給中國了

比福建艦還大！4艘萬噸巨船同時出塢，美這才明白，輸給中國了

溫讀史

2026-01-09 23:42:22

美數百架戰機集結，中國往伊朗運雷達？美媒：美軍或打中中俄軍艦

美數百架戰機集結，中國往伊朗運雷達？美媒：美軍或打中中俄軍艦

頭條爆料007

2026-02-20 11:41:26

顧丹真的漂亮

陳意小可愛

2026-02-19 03:41:59

糖尿病治愈療法來了，最快今年上市

糖尿病治愈療法來了，最快今年上市

醫學界

2026-02-21 18:39:50

棄用追夢，科爾決定引爆聯盟！30歲“病號”，才是庫里的絕佳搭檔

棄用追夢，科爾決定引爆聯盟！30歲“病號”，才是庫里的絕佳搭檔

體育大朋說

2026-02-21 21:19:32

娛樂圈「最美小三」復出，又翻紅了

娛樂圈「最美小三」復出，又翻紅了

獨立魚

2026-02-20 21:06:16

緊急預警！腦梗為啥總愛找中國人？80%的人都缺這種維生素

緊急預警！腦梗為啥總愛找中國人？80%的人都缺這種維生素

孟大夫之家1

2026-02-20 19:39:11

毛岸英究竟怎么犧牲的？2020年彭德懷發的絕密電報公開，寫了什么

毛岸英究竟怎么犧牲的？2020年彭德懷發的絕密電報公開，寫了什么

楚風說歷史

2026-02-18 07:25:03

河南隊官宣6虎加盟，海港鋒霸+前巴薩青訓妖星組鋒線，王國明續約

河南隊官宣6虎加盟，海港鋒霸+前巴薩青訓妖星組鋒線，王國明續約

替補席看球

2026-02-21 19:40:00

陽光城集團杭州項目破產清算

地產微資訊

2026-02-21 16:32:24

48小時大變臉！美國緊急撤回名單，高市急用簡體中文向中國低頭

48小時大變臉！美國緊急撤回名單，高市急用簡體中文向中國低頭

愛下廚的阿釃

2026-02-20 15:42:35

聽說閆學晶炫富導致中央戲劇學院的管理層都被團滅了！

聽說閆學晶炫富導致中央戲劇學院的管理層都被團滅了！

達文西看世界

2026-02-15 20:25:40

尼格買提春晚歸家驚現無綠葉菜，背后隱藏的新疆美食秘密！

尼格買提春晚歸家驚現無綠葉菜，背后隱藏的新疆美食秘密！

一盅情懷

2026-02-21 13:36:27

谷愛凌稱已不再奢望別人理解自己，不懂的永遠不會懂；“我想知道為什么總是這樣，我也不是故意要嚇大家”

谷愛凌稱已不再奢望別人理解自己，不懂的永遠不會懂；“我想知道為什么總是這樣，我也不是故意要嚇大家”

大風新聞

2026-02-20 15:00:25

中央明確養老金改革方向，2026年公平養老邁關鍵一步

中央明確養老金改革方向，2026年公平養老邁關鍵一步

風流女漢

2026-01-17 16:46:56

1965年毛主席批判《海瑞罷官》，田家英：那以后沒人敢研究歷史了

1965年毛主席批判《海瑞罷官》，田家英：那以后沒人敢研究歷史了

大運河時空

2026-02-18 11:35:03

越來越多人得癌癥，醫生提醒：洗碗時幾個壞習慣，你占了幾個？

越來越多人得癌癥，醫生提醒：洗碗時幾個壞習慣，你占了幾個？

39健康網

2026-02-20 09:31:06

73歲老太在烈士陵園掃墓，意外發現自己的名字，隨即驚動政府人員

73歲老太在烈士陵園掃墓，意外發現自己的名字，隨即驚動政府人員

搜史君

2026-01-04 18:15:03

墨菲：趙心童的發揮非常好，他在比賽中段的表現簡直就沒法打！

墨菲：趙心童的發揮非常好，他在比賽中段的表現簡直就沒法打！

世界體壇觀察家

2026-02-21 06:50:34

美最高法院6:3裁定特朗普關稅違法！1.4萬億美元收入“落空”，或撕開美國財政千億黑洞

美最高法院6:3裁定特朗普關稅違法！1.4萬億美元收入“落空”，或撕開美國財政千億黑洞

每日經濟新聞

2026-02-21 14:55:09

讓未來不止于大。

2242文章數 8042關注度

往期回顧全部

科技要聞

智譜上市1月漲5倍，市值超越京東、快手

頭條要聞

立陶宛總統繼續"嘴硬":不會跪下認錯中方要展現誠意

頭條要聞

立陶宛總統繼續"嘴硬":不會跪下認錯中方要展現誠意

體育要聞

冬奧第一"海王"？一人和13國選手都有關系

娛樂要聞

鏢人反超驚蟄無聲拿下單日票房第二！

財經要聞

一覺醒來，世界大變，特朗普改新打法了

汽車要聞

比亞迪的“顏值擔當”來了方程豹首款轎車路跑信息曝光

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

旅游

本地

游戲

公開課

軍事航空

旅游要聞

“誰說過年人少的？”深圳多景區火爆，網友直呼“把我擠瘦了”

本地新聞

春花齊放2026：《駿馬奔騰迎新歲》

賽博財神已就位，傳奇新百區起飛，散人這波真能吃飽

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
古代的馬真能日行八百里嗎
李彥宏：百度離破產30天

軍事要聞

硬核揭秘！福建艦“一馬當先”底氣何在

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<tr id="gl6l7"><span id="gl6l7"></span></tr>

<cite id="gl6l7"><strike id="gl6l7"></strike></cite>

<u id="gl6l7"></u>