<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Claude Opus 4.7 來了,編程能力又炸了

      Claude Opus4.7

      0
      分享至

      今天繼續聊 Claude —— Anthropic 剛剛正式發布了 Claude Opus 4.7,編程能力這次又是一次暴擊

      Benchmark 一覽

      下圖是 Anthropic 給出的跨領域 benchmark 對比,Opus 4.7 在大多數任務上超過了 Opus 4.6,以及 GPT-5.4 和 Gemini 3.1 Pro:


      Claude Opus 4.7 跨領域 Benchmark 對比 它比 Opus 4.6 強在哪?

      Anthropic 官方說,Opus 4.7 在高級軟件工程上是 Opus 4.6 的「顯著提升」,尤其是在那些最難的任務上

      這話我本來要打個折,但看了一圈測試用戶的反饋之后,我信了

      幾個讓我印象深刻的數據:

      • Cursor :在 93 個編程任務的 benchmark 上,任務解決率比 Opus 4.6 **提升了 13%**,包括 4 個 Opus 4.6 和 Sonnet 4.6 都搞不定的任務

      • Rakuten :在 SWE-bench 上,Opus 4.7 解決的真實生產 bug 是 Opus 4.6 的 3 倍

      • XBOW(自主滲透測試) :視覺準確性從 Opus 4.6 的 54.5% 直接干到 **98.5%**,這簡直是量變引發質變

      • Notion :工具調用準確率和規劃能力提升超過 **10%**,更難得的是,它是第一個通過隱式需求測試(implicit-need tests)的模型

      視覺能力:分辨率翻了 3 倍多

      這次 Opus 4.7 的視覺升級幅度相當大

      之前的 Claude 模型能接受的圖片分辨率,現在 Opus 4.7 可以接受最長邊 2,576 像素(約 3.75 百萬像素),是之前版本的 3 倍以上

      這意味著什么?

      • 讀密集截圖的 computer-use agent,再也不會因為文字太小看不清而出錯

      • 從復雜圖表里提取數據,精度大幅提升

      • 科學、法律文檔里那些需要像素級精準的工作,終于能干了

      來自 Solve Intelligence(生命科學專利工作流)的反饋印證了這一點:從化學結構式到復雜技術圖紙,理解能力大幅躍升

      注意這是模型層面的變化,不是 API 參數,圖片會自動以更高精度處理。但因為高分辨率圖片消耗 token 更多,如果你不需要那么高的精度,可以在發送前先降采樣

      指令遵循:這次是認真的

      Opus 4.7 在指令遵循上大幅提升

      聽起來是好事,但 Anthropic 自己也提醒了:之前給舊模型寫的 prompt,有時候會跑出意外結果——因為舊模型對指令是「松散理解」甚至跳過某些部分,現在 Opus 4.7 是字面意思照單全收

      所以如果你是 API 用戶,升級前最好重新審視一下你的 prompt,該精確的地方要精確,該刪掉的廢話要刪掉

      新功能:xhigh 努力等級

      Opus 4.7 引入了全新的 xhigh(extra high)努力等級,介于原來的 highmax 之間

      這給用戶提供了更細粒度的控制:在硬問題上,你可以選擇在「思考質量」和「響應延遲」之間找到更合適的平衡點

      在 Claude Code 里,現在默認把所有計劃的努力等級提升到了 xhigh

      官方建議在編程和 Agent 場景下測試時,從 highxhigh 開始

      下圖是不同努力等級下,token 使用量和任務得分的關系:


      不同努力等級下的 token 使用量與任務得分對比 網絡安全:先邁一步,但很謹慎

      Anthropic 上周公布了 Project Glasswing,直面 AI 在網絡安全領域的兩面性——風險與機遇。

      Opus 4.7 是 Glasswing 框架下第一個正式落地的模型,它的網絡安全能力不如 Claude Mythos Preview(目前最強的 Anthropic 模型),Anthropic 在訓練階段專門做了差異化處理,有意限制了部分網絡安全能力

      同時,Opus 4.7 配備了自動檢測和攔截高危網絡安全請求的防護機制

      真正有合法需求的安全研究人員、滲透測試工程師,可以通過 Cyber Verification Program 加入白名單

      這條路子我覺得挺對的:先在能力較弱的模型上驗證防護機制是否有效,積累經驗后,再逐步向更強的 Mythos 級別模型開放

      安全性測評
      Claude Opus 4.7 行為審計評分

      在安全對齊方面,Opus 4.7 和 Opus 4.6 整體差不多——欺騙行為、諂媚、濫用配合率都處于低水平

      部分維度(比如誠實性、對抗 prompt 注入攻擊)比 4.6 有改進,少數地方(比如有害物質信息的過度詳細回復)略微退步

      整體結論:「大體對齊、基本可信,但還沒達到理想狀態」

      Mythos Preview 依然是 Anthropic 目前對齊效果最好的模型

      價格 & 可用性

      好消息:價格不變,和 Opus 4.6 一樣:

      • 輸入:**$5 / 百萬 tokens**

      • 輸出:**$25 / 百萬 tokens**

      支持平臺:

      • Claude 全產品線

      • Claude API(模型 ID: claude-opus-4-7

      • Amazon Bedrock

      • Google Cloud Vertex AI

      • Microsoft Foundry

      還有這些新東西一起上

      隨 Opus 4.7 一起發布的還有幾個配套更新:

      1. /ultrareview 命令 (Claude Code):一鍵啟動深度代碼審查,像一個認真的 reviewer 一樣幫你找 bug 和設計問題,Pro 和 Max 用戶各有 3 次免費試用額度。

      2. Task Budgets(公測) (API):給開發者一個新機制,引導 Claude 在長任務中合理分配 token 預算,避免前緊后松或前松后緊

      3. Auto Mode 擴展 :Max 用戶現在也可以開啟 Auto Mode,讓 Claude 在長任務里自主決策權限請求,減少中斷

      升級注意事項

      如果你在生產上用 Opus 4.6,升級到 4.7 有兩個點要注意:

      1. 新 tokenizer :同樣的輸入,token 數大約會增加 1.0–1.35 倍 ,取決于內容類型

      2. 更高努力等級下思考更多 :尤其是 Agent 場景的后續對話輪次,輸出 token 會增加

      Anthropic 提供了遷移指南,建議先在真實流量上測一下差異

      總結

      Opus 4.7 的核心關鍵詞:編程更強、視覺更清、指令更準、安全更嚴

      如果你是:

      • Claude Code 用戶 :直接用,默認已升級到 xhigh 努力等級,新的 /ultrareview 也很值得試

      • API 開發者 :記得重新調 prompt,關注 token 用量變化,遷移指南先讀一遍

      • 網絡安全從業者 :有合法需求的走 Cyber Verification Program

      最讓我感興趣的其實是這個關于「更好同事」的描述——一個會在技術討論中反駁你、幫你做出更好決定的 AI

      這可能才是 AI 應該有的樣子,不是附和你,是真的幫你。

      .7

      制作不易,如果這篇文章覺得對你有用,可否點個關注。給我個三連擊:點贊、轉發和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      摧毀海上偷渡鏈!“獴獵”行動68人落網細節曝光

      摧毀海上偷渡鏈!“獴獵”行動68人落網細節曝光

      環球網資訊
      2026-04-19 13:23:28
      一輛20萬的新車,卡扣斷了,修不起;89元的零件 逼人換13萬電池包

      一輛20萬的新車,卡扣斷了,修不起;89元的零件 逼人換13萬電池包

      娛樂圈的筆娛君
      2026-04-20 02:07:08
      主動站出來認罪的紅色高棉頭目----一個劊子手的罪與贖

      主動站出來認罪的紅色高棉頭目----一個劊子手的罪與贖

      通往遠方的路
      2026-04-20 09:57:44
      中國有貨就是不賣!印度這次徹底失算,把全球供應商都惹毛了

      中國有貨就是不賣!印度這次徹底失算,把全球供應商都惹毛了

      一個有靈魂的作者
      2026-04-19 19:40:53
      重要突破,科學家注射一個腫瘤細胞,全身癌細胞竟然消失

      重要突破,科學家注射一個腫瘤細胞,全身癌細胞竟然消失

      心中的麥田
      2026-04-19 18:26:11
      伊朗向中國通報!談判團差點被美軍“團滅”,全程連電話都不敢打

      伊朗向中國通報!談判團差點被美軍“團滅”,全程連電話都不敢打

      荷蘭豆愛健康
      2026-04-19 21:53:37
      越南百億高鐵訂單給德國,來華體驗12小時高鐵,背后算計太明顯

      越南百億高鐵訂單給德國,來華體驗12小時高鐵,背后算計太明顯

      苗苗情感說
      2026-04-19 12:38:15
      文班亞馬季后賽首秀:傳承開始

      文班亞馬季后賽首秀:傳承開始

      張佳瑋寫字的地方
      2026-04-20 12:23:10
      張蘭暗示兒媳馬筱梅欲望旺盛,汪小菲別墅空調失靈,覬覦婆婆宅邸

      張蘭暗示兒媳馬筱梅欲望旺盛,汪小菲別墅空調失靈,覬覦婆婆宅邸

      樂悠悠娛樂
      2026-04-20 10:47:48
      爺爺生前錄音贈孫女109萬元遺產,六個姑姑不服要求平分,法院:錄音無效,重新分配,患小兒麻痹癥姑姑拿大頭

      爺爺生前錄音贈孫女109萬元遺產,六個姑姑不服要求平分,法院:錄音無效,重新分配,患小兒麻痹癥姑姑拿大頭

      魯中晨報
      2026-04-17 17:00:03
      600年都不倒!天安門這4根重達2萬多公斤的華表,有何特殊含義?

      600年都不倒!天安門這4根重達2萬多公斤的華表,有何特殊含義?

      墨印齋
      2026-04-14 00:57:55
      復雜的黎巴嫩,走投無路的真主黨

      復雜的黎巴嫩,走投無路的真主黨

      寰宇大觀察
      2026-04-17 17:36:11
      靈隱寺砸飯碗!浙江4000寺廟大洗牌,滿街僧人有玄機

      靈隱寺砸飯碗!浙江4000寺廟大洗牌,滿街僧人有玄機

      一口娛樂
      2026-04-20 01:43:39
      解氣!!!來而不往非禮也!中國海軍今天出手了!

      解氣!!!來而不往非禮也!中國海軍今天出手了!

      樂趣紀史
      2026-04-20 08:03:19
      浙江25歲女子深夜跑進急診,疼到臉色發白,醫生:近兩三年這類患者越來越多,嚴重的會造成不可逆傷害

      浙江25歲女子深夜跑進急診,疼到臉色發白,醫生:近兩三年這類患者越來越多,嚴重的會造成不可逆傷害

      環球網資訊
      2026-04-20 09:25:07
      張本兄妹改名風波再升級,韓媒強烈批評,這就是狠毒的創姓改稱

      張本兄妹改名風波再升級,韓媒強烈批評,這就是狠毒的創姓改稱

      有范又有料
      2026-04-19 00:03:10
      張雪機車,全球訂單狂飆

      張雪機車,全球訂單狂飆

      第一財經資訊
      2026-04-18 18:42:46
      張雪回應為何還有6圈提前結束比賽:有事故摩托車橫躺在賽道上

      張雪回應為何還有6圈提前結束比賽:有事故摩托車橫躺在賽道上

      貝殼財經
      2026-04-19 23:56:03
      一伊朗油輪突破美國封鎖進入伊朗水域

      一伊朗油輪突破美國封鎖進入伊朗水域

      每日經濟新聞
      2026-04-20 07:10:32
      “DeepSeek首次融資”傳聞震動市場!寒武紀、沐曦股份、摩爾線程和張雪機車的天使投資人都回應了

      “DeepSeek首次融資”傳聞震動市場!寒武紀、沐曦股份、摩爾線程和張雪機車的天使投資人都回應了

      證券時報
      2026-04-19 22:52:02
      2026-04-20 12:55:00
      Ai學習的老章 incentive-icons
      Ai學習的老章
      Ai學習的老章
      3334文章數 11137關注度
      往期回顧 全部

      科技要聞

      藍色起源一級火箭完美回收 客戶衛星未入軌

      頭條要聞

      媒體:伊朗剛說不談 美國立即開打

      頭條要聞

      媒體:伊朗剛說不談 美國立即開打

      體育要聞

      七大獎項候選官宣!文班或全票DPOY

      娛樂要聞

      鹿晗生日上熱搜,被關曉彤撕下體面

      財經要聞

      月之暗面IPO迷局

      汽車要聞

      把天門山搬進廠?開仰望U8沖上45度坡的那刻 我腿軟了

      態度原創

      藝術
      教育
      游戲
      本地
      軍事航空

      藝術要聞

      王羲之《換鵝帖》尚在人間,驚艷無比!

      教育要聞

      我發現一個殘酷真相:孩子長大后,最怨恨的不是管太嚴的父母……

      異世界自動化模擬經營游戲《退休勇者當廠長》現已正式上架Steam

      本地新聞

      12噸巧克力有難,全網化身超級偵探添亂

      軍事要聞

      特朗普:美艦向伊朗貨船開火炸出個洞

      無障礙瀏覽 進入關懷版