網易首頁 > 網易號 > 正文申請入駐

剛剛，Claude Opus 4.7突然發布：不是最強，但奧特曼又得失眠

2026-04-17 01:35:26　來源: 愛范兒

廣東舉報

分享至

今年 Anthropic 的勢頭異常兇猛。

不僅熱度居高不下，口碑也持續攀升，穩坐 AI 圈「頂流」的交椅。現在幾乎每天醒來，都能看到他們準點推送的新產品或新功能。久而久之，大家也從興奮變成了「是你，果然又是你」的默契感。

而就在剛剛，萬眾期待的 Claude Opus 4.7 也正式發布，依舊是熟悉的配方，熟悉的高分選手。

有趣的是，Anthropic 在公告里非常坦誠，甚至帶著點驕傲：「這并非我們最強大的模型?！鼓莻€傳說強得可怕的 Claude Mythos Preview 依然還在藏。

但就是這個并非最強的 Opus 4.7，卻依舊引發了極大的關注。因為它解決了一個比聰明更重要的痛點：靠譜。不是那種你說什么它就做什么的靠譜，而是當你提出一個愚蠢的方案時，它敢于反駁你，并自己把坑填上的靠譜。

當靠譜成為比聰明更稀缺的品質

基準測試結果顯示，在業界公認最硬核的 SWE-bench Pro 上，4.7 從前代的 53.4% 直接拉到 64.3%，單代升級漲了近 11 個百分點，把 GPT-5.4（57.7%）和 Gemini 3.1 Pro（54.2%）都甩在了身后。

視覺推理的 CharXiv 基準從 69.1% 跳到 82.1%，對應的是它新獲得的 2576 像素長邊識別能力——清晰度是前代的 3 倍以上。

這不只是「看得更清楚」這么簡單。更高的分辨率直接帶動了輸出質量的連鎖提升：生成界面、制作幻燈片、排版文檔，細節精度也全面提升。

工具調用規?；u測 MCP-Atlas 上，4.7 跑出 77.3%，超過 GPT-5.4 的 68.1% 和 Gemini 的 73.9%。法律 AI 平臺 Harvey 測試中，4.7 在 BigLaw 基準上拿下 90.9%，正確區分了歷來是前沿模型死穴的「轉讓條款」與「控制權變更條款」。

不過，4.7 也并非全然遙遙領先，在 Agentic search 評測 BrowseComp 上，4.7 反而從前代的 83.7% 下降到了 79.3%，被 GPT-5.4（89.3%）和 Gemini（85.9%）超越。

這個退步并非偶然。一個遇到缺失信息會直接報錯、不肯亂編答案的 Agent，在以「是否給出答案」為評判標準的基準上，天然會吃虧。

而數據之外，更值得關注的問題是：這種「靠譜」，在真實工作里到底意味著什么？

過去一年，業界對代碼大模型的期待，普遍還停留在「寫個函數、找個 Bug」的層面，但 Claude 4.7 在早期測試里，展現出了一種截然不同的氣質。

知名云端開發平臺 Replit 的負責人這樣描述：「它在技術討論中會反駁我，幫我做出更好的決定。它真的感覺像一個更好的同事?！?/p>

它不再一味地「唯命是從」，也不再為了交差而胡編亂造。在數據科學平臺 Hex 的測試里，4.7 遇到缺失數據時會直接報錯，而不是像前代那樣塞一個「看似合理但完全錯誤」的備選值。Hex 團隊甚至直言：「低消耗狀態下的 4.7，等同于中等消耗狀態下的 4.6。」

這種「拒絕順從」的特質，恰恰是高級軟件工程里最稀缺的東西。

當然，凡事有兩面。為舊模型寫的 prompt，到了 4.7 手里可能會產生意想不到的結果。那些過去被模型「意會」掉的模糊指令，4.7 會一字一字地字面執行。這也意味著越懂得清楚表達需求的人，越能從 4.7 這里拿到好結果。

光會「頂嘴」還不夠，遇到挫折就罷工的 AI 同樣不是好同事。4.7 的另一個大的變化，是任務韌性。

以往大模型在多步任務中遇到工具調用失敗，往往直接停機報錯。Notion 團隊測試發現，4.7 的工具錯誤率降到了原來的三分之一，更關鍵的是，它能在工具鏈崩潰時自己繞過障礙，繼續把任務跑完。

當 AI 停止諂媚，真正的生產力才開始爆發。

Anthropic 公布的一個極端案例里，4.7 在沒有任何人類干預的情況下，從零構建了一個完整的 Rust 文本轉語音引擎——寫神經網絡模型、SIMD 內核和瀏覽器演示，還自己把輸出喂給語音識別器做驗證，連測試都一并完成了。

前端框架巨頭 Vercel 還發現了一個過去從未有過的行為：4.7 會在開始寫系統級代碼之前，先自己進行數學證明。這已經超出了寫代碼的范疇，進入了嚴謹工程設計的領域。

雇傭 AI「資深專家」的代價

為了驗證它在細節上的處理能力，我設定了三個前端交互場景，評判標準只有一個：細節是否敷衍，一眼便知。

第一個場景，是讓它做一個俯視視角的黑膠唱片機界面，其難點在于「金屬光澤」與「呼吸光暈」的呈現。4.7 并沒有用廉價的色彩漸變敷衍了事，而是通過復雜的 CSS 樣式疊加，逼真地還原了金屬質感。

第二個場景是只用 CSS，不用 JavaScript 做一個老式電風扇。面對這個限制嚴格的題目，一些模型會悄悄違規使用 JS，但 4.7 遵守了規則。它用純 CSS 做出了風扇的立體結構，低中高三檔過渡流暢，底座透視和陰影的處理也真有一點實物感，它在規則允許的范圍內找到了很好的解決辦法。

第三個場景是做一個復古磁帶隨身聽，帶有錄像帶那種老舊的噪點效果。磁帶轉動的細節也是有的。

當然，變聰明是有代價的。Opus 4.7 現已在所有 Claude 產品和 API、Amazon Bedrock、Google Cloud 的 Vertex AI 以及 Microsoft Foundry 平臺上推出。

基礎定價維持在每百萬輸入 5 美元、輸出 25 美元不變。但 4.7 引入了全新分詞器，同樣的文本會拆分出比原來多 1.0 到 1.35 倍的 Token。

疊加上它在高強度任務中本身就傾向于「多想一會兒」，實際消耗幾乎必然上升。

此外，Anthropic 在原有的難度選項之上，加入了全新的 xhigh（超高）級別。在這個級別下，面對復雜難題，Claude 4.7 會消耗更多的 Token，花更多的時間去「思考」。Claude Code 已經把所有套餐的默認 effort level 直接拉到了 xhigh。

Anthropic 用行動告訴所有人，對于真正的編碼任務，省著用不如想清楚。

為了匹配這種工作流，Claude Code 順勢推出了兩個殺手級功能：

/ultrareview（深度審查）：開啟一個專門的審查會話，像一個極其挑剔的資深 Reviewer 一樣，通讀所有代碼更改，精準標記出深層的架構設計缺陷和 Bug。Pro 和 Max 用戶可以免費試用三次。

Auto Mode（自動模式）擴展到 Max 用戶：一種介于「逐項授權」和「跳過所有權限」之間的新權限模式。Claude 會在你授權的范圍內自主做決策，既能跑完漫長無聊的任務，又比完全放權更安全。

為了防止這個「太能思考」的 AI 把賬戶余額刷爆，API 端還推出了「任務預算」（Task Budgets）功能公測版，讓開發者可以顯式規劃 Claude 在長任務中的 Token 支出優先級。

當然，4.7 并不是 Anthropic 手里最強的牌。

那個更強的 Claude Mythos Preview，本月剛以「Project Glasswing」的名義，小范圍開放給了一批企業用于網絡安全研究。Mythos 沒有公開發布，原因則是因為它的網絡攻防能力太強，Anthropic 覺得還沒想清楚怎么安全地推給所有人。

4.7 本身也做了主動取舍，訓練階段就壓低了網絡攻防能力，內置自動攔截機制，碰到高風險請求直接擋掉。有合規需求的安全研究人員，可以通過官方渠道單獨申請。

不急著把最強的牌打出去，和不停地往桌上加新牌，背后是同一套邏輯。實際上，Anthropic 真正的護城河，是交付節奏本身。

在今年 2 月 1 日至 3 月 24 日，短短 52 天里，Anthropic 一共更新了 74 款產品，平均不到兩天一個。Cowork、插件……這些動作扎扎實實地擊中了職場辦公的痛點。

如今的 Claude 生態，早就超越了單純的「聊天機器人」。對于那些渴望將 AI 深度嵌入實際工作流的團隊而言，這種穩定、高頻且可預期的更新節奏，才是最讓人感到踏實的定心丸。

今天發布的 Claude 4.7，是這條鏈條上最新的一塊壓艙石。而那個 Mythos Preview，遲早也會來。到那時候，我們現在覺得已經很能打的 4.7，可能只是個開端。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Opus 4.7重新登頂榜單，但強得多的GPT-5.5極大概率下周就發

新智元 2026-04-19 19:05:24
8 跟貼 8
突然變強！速度翻4倍，GPT Pro驚現「神級」操作，網友懷疑GPT-5.5已就位

新智元 2026-04-20 17:10:50
0 跟貼 0

行動奇點降臨！Mythos把AI從「會說」跨進「動手」時代

新智元 2026-04-21 11:03:13
0 跟貼 0

瑞銀評智譜--“中國版Anthropic”

華爾街見聞官方 2026-04-21 09:47:50
0 跟貼 0
Monet：賦予多模態大模型如人類一般的抽象視覺思考能力

機器之心Pro 2026-04-20 21:05:03
0 跟貼 0

月之暗面發布K2.6，楊植麟真的需要一個郭達雅

鈦媒體APP 2026-04-21 09:28:15
0 跟貼 0

智能體崛起后，整個AI價值鏈的分布都變了！大摩：GPU不再是一切

華爾街見聞官方 2026-04-21 10:29:50
0 跟貼 0
AURA：讓視頻大模型從“看完再答”，走向邊看邊理解、邊看邊響應

機器之心Pro 2026-04-21 12:06:30
0 跟貼 0

GEO如何改變品牌？中國人民大學新聞學院教授王菲：被正確理解，才能被持續看見

每日經濟新聞 2026-04-20 20:56:03
0 跟貼 0
減速機訂單已排到明年！

財聯社 2026-04-21 07:54:05
347 跟貼 347
從追逐流量到獲取信任跨界大咖共話AI浪潮下的品牌新基建

每日經濟新聞 2026-04-21 13:32:07
0 跟貼 0
阿里布局“千問小酒窩”：背后是具身智能的博弈

華爾街見聞官方 2026-04-21 13:33:23
0 跟貼 0
VAST+香港大學AniGen把AIGC推向動畫、游戲、仿真與具身智能

機器之心Pro 2026-04-21 12:13:21
0 跟貼 0
以人為本的AI對用戶而言才是最有用的AI

每日經濟新聞 2026-03-14 13:16:04
0 跟貼 0
女子乘船時同大雁“齊飛”，兩手輕撫托舉畫面和諧美好

北青網-北京青年報 2026-04-21 04:02:12
1008 跟貼 1008
日本奧特曼視角曝光，原來是這樣拍攝的，兒時疑惑解開！

阿酞侃生活 2026-04-20 15:55:26
0 跟貼 0
買房邏輯已變，我們如何應對？

搞笑枇杷 2026-04-20 02:44:58
0 跟貼 0
“龍蝦”JiuwenClaw率先開啟“Coordination Engineering”時代

量子位 2026-04-20 21:01:32
0 跟貼 0
Qwen3.6超大杯來了！我用這個“半成品”模型，親手造了一個macOS桌面

智東西 2026-04-20 19:08:36
3 跟貼 3
V8發動機模型

制造科技 2026-04-19 17:41:19
0 跟貼 0
男子爬上泰山“五岳獨尊”石刻拍照，景區：將核查其身份進行處理

揚子晚報 2026-04-17 12:09:40
1410 跟貼 1410
川崎 H2R模型摩托

制造科技 2026-04-16 21:58:46
15 跟貼 15
動動嘴寫SQL！Codex+終身記憶，OpenAI把查詢難度直接歸零

新智元 2026-04-20 19:32:59
0 跟貼 0
Claude 進了 Word，但“修訂模式”不是新發明

數字力場 2026-04-20 20:05:20
9 跟貼 9
保價2000元機蓋運輸中損壞，德邦理賠只肯賠1300元；車主：我不要錢了，你賠我一個機蓋總可以吧

大風新聞 2026-04-20 19:12:04
661 跟貼 661
高峰期作業、粗暴噴灑！深圳市民吐槽灑水車成 “擾民車”

南方都市報 2026-04-20 23:12:18
743 跟貼 743
驗資3000萬每日預約名單仍排滿，高凈值人群“排隊”看房，4月的杭州樓市是高端局

都市快報橙柿互動 2026-04-20 14:35:53
159 跟貼 159
黎巴嫩再成戰場民眾：在這沒有人沒有失去過親近的人

新京報 2026-04-20 08:22:24
888 跟貼 888
90%出租率仍被漲租逼退：麗柏廣場招拍掛背后的環市東商圈之困

新快報新聞 2026-04-20 17:53:06
156 跟貼 156
它喊著防止追尾，卻又有意急剎，設計這個邏輯的公司真無敵了！

旅行指南者 2026-04-20 09:47:38
0 跟貼 0
榮耀推出「養蝦本」，這才是 2026 年 AIPC 的答案

愛范兒 2026-04-21 11:10:12
0 跟貼 0
深圳一火鍋店招985和211大學應屆生儲備店長，從服務員做起，門店負責人：本科生就行，已有985管培生

極目新聞 2026-04-20 14:14:59
371 跟貼 371
廣西一小學食堂員工疑多次把營養午餐帶回家，官方通報：系將剩余飯菜帶回家喂養家禽，不存在克扣學生營養午餐情況

大象新聞 2026-04-21 09:15:04
266 跟貼 266
當我有一個認識奧特曼全家桶的權威女友！

原來是你kk 2026-04-20 08:00:00
0 跟貼 0
東契奇落選MVP候選：規則硬邊界的代價

熱血體育社 2026-04-20 19:01:21
3 跟貼 3
浦東新添一家三甲醫院，上海長征醫院浦東院區明起面向社會公眾服務

澎湃新聞 2026-04-20 13:58:26
464 跟貼 464
搞笑圖集 | 釣魚佬的天塌了

講故事的菠蘿君 2026-04-21 12:15:07
0 跟貼 0
程序員：好消息是我的代碼能跑了，壞消息是我跑不過我的代碼

重慶頭條官方 2026-04-19 20:24:03
0 跟貼 0
猴子也有邏輯,這操作,把大哥看笑了

咖啡_1 2026-04-19 11:02:23
0 跟貼 0
烤腸攤主穿奧特曼服裝,一絲不茍穿烤腸樣子,人老了干啥都心酸！

歡樂生產地 2026-04-21 11:56:46
1 跟貼 1

愛范兒

消費科技第一媒體

38724文章數 2601528關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

教育

時尚

本地

軍事航空

手機 / 數碼

房產 / 家居

剛剛，Claude Opus 4.7突然發布：不是最強，但奧特曼又得失眠

重磅官宣：庫克卸任，特努斯接任蘋果CEO

匈牙利當選總理毛焦爾：若內塔尼亞胡入境 必將被逮捕

匈牙利當選總理毛焦爾：若內塔尼亞胡入境 必將被逮捕

“被優化”8年后，國乒方博決定換一條路重新上場

周潤發時隔16年再賣樓，變現數億資產

減速機訂單已排到明年！

把天門山搬進廠?開仰望U8沖上45度坡的那刻 我腿軟了

態度原創

干細胞抗衰4大誤區,90%的人都中招

全民閱讀大會少年走心感悟，人生自有方向

“爆冷”又如何？陳法拉的人生本就是一場逆襲大戲

春色滿城關不?。座N梅浪漫盛放，吳山藏了一片四月雪

特朗普公開對伊開戰真正原因

剛剛，Claude Opus 4.7突然發布：不是最強，但奧特曼又得失眠

重磅官宣：庫克卸任，特努斯接任蘋果CEO

匈牙利當選總理毛焦爾：若內塔尼亞胡入境必將被逮捕

匈牙利當選總理毛焦爾：若內塔尼亞胡入境必將被逮捕

“被優化”8年后，國乒方博決定換一條路重新上場

周潤發時隔16年再賣樓，變現數億資產

減速機訂單已排到明年！

把天門山搬進廠?開仰望U8沖上45度坡的那刻我腿軟了

“爆冷”又如何？陳法拉的人生本就是一場逆襲大戲

春色滿城關不?。座N梅浪漫盛放，吳山藏了一片四月雪