<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      Claude Opus 4.5來了:谷歌把Anthropic逼到了墻角

      0
      分享至

      上周,Google實在是太猛了,拳打OpenAI,腳踢Anthropic。Gemini 3 Pro模型在編程、數(shù)學(xué)、推理等能力上都達到了當之無愧的SOTA級別。


      被逼到墻角之后,就看誰先有能力掀桌坐不住了。

      于是,就在今天,Anthropic發(fā)布了Claude Opus 4.5。


      Opus 4.5的核心還是聚焦在編程能力,可以說很炸裂:SWE-bench Verified達到80.9%,首次突破80%,超越Gemini 3 Pro的76.2%。


      以及,很少見的是,他們甚至降價了!價格從之前的貴得離譜的$15/$75直接降到$5/$25 per million tokens,直降66%!!

      Opus 4.5的發(fā)布,說明Anthropic是真的急了——或者說,終于認真了。

      Opus 4.5到底有多強?

      先說benchmark數(shù)據(jù)。

      SWE-bench Verified:80.9%

      這是業(yè)界公認的編程能力測試標準。Opus 4.5是第一個突破80%的模型。

      對比一下:

      - Gemini 3 Pro:76.2%

      - Claude Sonnet 4.5:77.2%

      - GPT-5.1:76.3%/77.9%

      80.9%是什么概念?Anthropic內(nèi)部拿性能工程師的面試題測試,Opus 4.5的得分超過了所有人類候選人。


      Terminal-bench 2.0:59.3%

      這個測試主要看模型在終端環(huán)境下的編程能力。Opus 4.5比Gemini 3 Pro高了5個百分點(54.2%),比自家的Sonnet 4.5高了近10個百分點(50.0%)。

      這個差距說明一個事實:Claude在真實開發(fā)環(huán)境下,就是比其他模型強。

      GPQA Diamond:87.0%

      這是研究生級別的推理測試,涵蓋物理、化學(xué)、生物。Opus 4.5在這個測試上落后于Gemini 3 Pro(91.9%),但87%的成績也不差。

      總結(jié)一下:編程能力世界第一,推理能力也不弱。

      價格策略的巨大轉(zhuǎn)變

      Opus 4.5最讓人意外的,是在性能提升的同時,價格還暴降了。

      新定價:

      - 輸入:$5 / million tokens

      - 輸出:$25 / million tokens

      Anthropic的官方說法是:"making Opus-level capabilities accessible to even more users, teams, and enterprises"(讓更多用戶、團隊和企業(yè)能用上Opus級別的能力)。

      邏輯很明顯:Anthropic需要更多人用Opus。

      之前Opus的定位是"高端用戶",但高端市場就那么大。現(xiàn)在降價,是要搶占"中端市場"——那些之前用Sonnet,但其實需要更強能力的開發(fā)者。

      不到一周,正面交鋒

      11月18日,Google發(fā)布Gemini 3 Pro。

      11月24日,Anthropic發(fā)布Claude Opus 4.5。

      不到一周,兩個頂級模型連續(xù)發(fā)布。

      這不是巧合。

      Gemini 3 Pro發(fā)布時,各種benchmark數(shù)據(jù)都很炸裂,尤其是GPQA Diamond的91.9%,直接刷新了推理能力的記錄。當時AI圈的共識是:Google這次真的起來了。


      Anthropic當然不會讓Google獨占風頭。

      Opus 4.5的發(fā)布時機,明顯是沖著Gemini 3來的。而且,Anthropic選擇的戰(zhàn)場很聰明:不和你比推理,和你比編程。

      Gemini 3 Pro在推理上確實強(91.9% vs 87.0%),但在編程上,Claude Opus 4.5領(lǐng)先了近5個百分點(80.9% vs 76.2%)。

      更關(guān)鍵的是,編程能力是開發(fā)者最關(guān)心的指標。推理能力再強,如果寫不出好代碼,開發(fā)者也不會買單。

      這就是Anthropic的策略:在自己最擅長的領(lǐng)域,做到絕對領(lǐng)先。

      為什么Anthropic能在編程上這么強?

      之前我在測試Claude Code時,有個很深的感受:

      Claude Code好用的邏輯,不是因為它是終端工具,而是因為Anthropic有模型成本和模型認知的優(yōu)勢。

      他們可以更無所畏懼地投喂代碼上下文燒token,能知道如何擠壓模型Agentic的能力實現(xiàn)更長步驟的推理,可以用agentic search而非RAG的方式處理上下文。

      這些優(yōu)勢,說白了就一個原因:Anthropic從一開始就是奔著編程和Agent去優(yōu)化模型的。

      我之前評價Claude 4時說:最強編程模型 + 最強Agent基建。

      Anthropic對模型的所有優(yōu)化,都是奔著To B做AI coding和讓開發(fā)者建agent而去的。他們主要做了這幾個方面的優(yōu)化:

      1. 擴展思維與工具使用:允許模型在思考和使用工具之間來回切換,形成"思考-執(zhí)行-再思考"的循環(huán)

      2. 改進的記憶能力:可以創(chuàng)建和維護"記憶文件"來存儲關(guān)鍵信息,支持長時間任務(wù)

      3. 更強的指令遵循能力:可以處理超過10000個token的系統(tǒng)提示

      4. 減少獎勵黑客行為:模型為了達到目標而走捷徑的傾向降低了80%以上

      這些優(yōu)化,放在Opus 4.5上,效果更明顯了。

      相比之下,Gemini 3的優(yōu)勢在于多模態(tài)。如果你的任務(wù)涉及視覺、圖片、視頻,Gemini 3會更強。但如果是純編程任務(wù),Claude Opus 4.5幾乎沒有對手。

      產(chǎn)品層面的配合

      Opus 4.5的發(fā)布,不是孤立的。

      Anthropic同時推出了幾個重要的產(chǎn)品更新:

      1. Claude Code進入桌面端:支持并行運行多個本地和遠程會話,長對話自動總結(jié)早期上下文

      2. Claude for Chrome:擴展至所有Max用戶

      3. Claude for Excel:面向所有Max、Team和Enterprise用戶正式發(fā)布

      這些產(chǎn)品更新,都是在強化一個信號:Claude不只是一個聊天模型,它是一個生產(chǎn)力工具。

      尤其是Claude Code。

      我之前說過,從工具層面來說,從Cursor這種IDE圖形界面退回到Claude Code這種終端命令行工具,其實是個挺大的退步。但Claude Code之所以還是比Cursor好用,就是因為它背后的模型能力太強了。

      現(xiàn)在Opus 4.5出來了,Claude Code的優(yōu)勢會更明顯。

      而且,Anthropic還宣布了和Microsoft、NVIDIA的戰(zhàn)略合作:Claude擴展至Azure平臺,由NVIDIA提供算力支持。這意味著,Claude的To B布局在快速推進。

      開發(fā)者該怎么選?

      最后說點實際的:如果你是開發(fā)者,該選Claude還是Gemini?

      我的建議是:

      選Claude Opus 4.5,如果你的任務(wù)主要是:

      • 純代碼編寫和調(diào)試

      • 后端邏輯和復(fù)雜推理

      • 長時間的編程任務(wù)(需要記憶和上下文管理)

      選Gemini 3 Pro,如果你的任務(wù)主要是:

      • 多模態(tài)任務(wù)(涉及圖片、視頻、視覺)

      • 前端、UI設(shè)計

      • 需要超強推理能力的研究級任務(wù) 如果預(yù)算夠,最好的辦法是:兩個都用。

      Claude處理編程,Gemini處理多模態(tài)。各取所長。

      我前兩天剛剛同時用Claude Code+Gemini 3 Pro,開發(fā)了一個有儀式感地記錄日常生活和靈感碎片的app「小票筆記 - Thermal」,在開發(fā)這款app時,我的工作步驟和體驗是:

      1)Gemini 3在生成和復(fù)刻前端效果上明顯表現(xiàn)更優(yōu)

      2)實際的開發(fā)和解決bug的過程,Claude Code還是比Cursor + Gemini 3 Pro,或者使用Antigravity的體驗,因為長程的編程能力還需要工具更好的工程化能力,以及模型更底層的編程能力。




      最后

      Opus 4.5的發(fā)布,不是孤立事件。

      它是Anthropic在編程和Agent這條路上的又一次發(fā)力,是對Gemini 3的正面回應(yīng),也是對自己商業(yè)化策略的調(diào)整。

      Anthropic這么跳,說明AI大模型的競爭進入白熱化了。

      對開發(fā)者來說,這是好事。模型越來越強,價格越來越低,工具越來越好用。

      接下來,看OpenAI怎么接招。

      當然,如果你因為訂閱或者網(wǎng)絡(luò)問題不方便使用原版Claude Code的話,也歡迎試試我前段時間開發(fā)的GLM Code:

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      貝加爾湖底的七名中國游客,本來是可以不用死的

      貝加爾湖底的七名中國游客,本來是可以不用死的

      未來展望
      2026-02-21 00:23:41
      烏克蘭的“壞消息”:破壞團結(jié),扎盧日內(nèi)公開指控澤連斯基

      烏克蘭的“壞消息”:破壞團結(jié),扎盧日內(nèi)公開指控澤連斯基

      鷹眼Defence
      2026-02-20 17:49:36
      發(fā)現(xiàn)一個悲哀現(xiàn)象:中國的長壽老人,幾乎都是子女用生命在托舉

      發(fā)現(xiàn)一個悲哀現(xiàn)象:中國的長壽老人,幾乎都是子女用生命在托舉

      談史論天地
      2026-02-21 08:33:48
      澤連斯基的日常:凌晨3點開工、靠黑咖啡硬撐!戰(zhàn)爭讓他容貌巨變

      澤連斯基的日常:凌晨3點開工、靠黑咖啡硬撐!戰(zhàn)爭讓他容貌巨變

      老馬拉車莫少裝
      2026-02-21 00:16:58
      香港公布宏福苑長遠居住安排方案

      香港公布宏福苑長遠居住安排方案

      界面新聞
      2026-02-21 15:25:17
      中央氣象臺繼續(xù)發(fā)布暴雪、寒潮藍色預(yù)警

      中央氣象臺繼續(xù)發(fā)布暴雪、寒潮藍色預(yù)警

      每日經(jīng)濟新聞
      2026-02-21 11:55:05
      7名中國游客在貝加爾湖遇難,目擊者稱事發(fā)冰面表面光滑但下方有裂縫,總領(lǐng)事館:已與遇難人員家屬建立聯(lián)系

      7名中國游客在貝加爾湖遇難,目擊者稱事發(fā)冰面表面光滑但下方有裂縫,總領(lǐng)事館:已與遇難人員家屬建立聯(lián)系

      極目新聞
      2026-02-21 14:31:40
      48歲歐陽夏丹父母雙亡獨自過年,一個人吃7道菜,大口吃飯不矯情

      48歲歐陽夏丹父母雙亡獨自過年,一個人吃7道菜,大口吃飯不矯情

      離離言幾許
      2026-02-20 23:38:28
      夫婦路邊散步撿到帆布袋,里面裝了20多個紅包共7萬多元,失主回應(yīng):是4個孩子的壓歲錢,廣東人:驚呆了......

      夫婦路邊散步撿到帆布袋,里面裝了20多個紅包共7萬多元,失主回應(yīng):是4個孩子的壓歲錢,廣東人:驚呆了......

      極目新聞
      2026-02-21 08:51:20
      賈淺淺《開花》被獲得全國詩歌一等獎的詩,寫出了女性的原始欲

      賈淺淺《開花》被獲得全國詩歌一等獎的詩,寫出了女性的原始欲

      讀睡
      2026-02-20 16:29:43
      狂炫5斤車厘子和紅燒肉,12歲男孩進了重癥監(jiān)護室

      狂炫5斤車厘子和紅燒肉,12歲男孩進了重癥監(jiān)護室

      現(xiàn)代快報
      2026-02-21 13:58:06
      33.9萬!火鍋店稱把春節(jié)4天盈利分給員工,老板:去年關(guān)了兩家店 但春節(jié)福利要堅持

      33.9萬!火鍋店稱把春節(jié)4天盈利分給員工,老板:去年關(guān)了兩家店 但春節(jié)福利要堅持

      紅星新聞
      2026-02-21 10:12:08
      罄!告急!有跨省回上海返程機票高達11560元

      罄!告急!有跨省回上海返程機票高達11560元

      新民晚報
      2026-02-21 12:30:00
      男子拿錯快遞,把白糖當?shù)咨车惯M魚缸!網(wǎng)友:魚要崩潰了……

      男子拿錯快遞,把白糖當?shù)咨车惯M魚缸!網(wǎng)友:魚要崩潰了……

      環(huán)球網(wǎng)資訊
      2026-02-21 16:00:42
      特朗普宣布加征10%全球進口關(guān)稅,白宮公布豁免范圍

      特朗普宣布加征10%全球進口關(guān)稅,白宮公布豁免范圍

      界面新聞
      2026-02-21 11:05:45
      男子打麻將連續(xù)自摸胡牌后突然癱倒在牌桌前!送醫(yī)時血壓飆到201/115mmHg

      男子打麻將連續(xù)自摸胡牌后突然癱倒在牌桌前!送醫(yī)時血壓飆到201/115mmHg

      閃電新聞
      2026-02-20 22:54:48
      毛奇、李佩霞2026年近況公布,兩人服刑結(jié)局給所有人提了醒

      毛奇、李佩霞2026年近況公布,兩人服刑結(jié)局給所有人提了醒

      娛樂督察中
      2026-02-21 03:23:47
      媽祖事件真相大白,紅衣女孩已做多年乩童,這三年來變化越來越大

      媽祖事件真相大白,紅衣女孩已做多年乩童,這三年來變化越來越大

      觀察鑒娛
      2026-02-21 10:51:24
      特朗普暗示違法征收的關(guān)稅不退了

      特朗普暗示違法征收的關(guān)稅不退了

      財聯(lián)社
      2026-02-21 06:46:21
      扶老人被索賠22萬?資深律師:初中生擔責有據(jù)!

      扶老人被索賠22萬?資深律師:初中生擔責有據(jù)!

      閃電新聞
      2026-02-21 10:15:27
      2026-02-21 16:35:00
      AI進化論花生 incentive-icons
      AI進化論花生
      AI博主,AppStore付費榜第一的小貓補光燈app開發(fā)者
      142文章數(shù) 64關(guān)注度
      往期回顧 全部

      科技要聞

      智譜上市1月漲5倍,市值超越京東、快手

      頭條要聞

      在貝加爾湖遇難的3名中國游客身份已確認:系一家人

      頭條要聞

      在貝加爾湖遇難的3名中國游客身份已確認:系一家人

      體育要聞

      冬奧第一"海王"?一人和13國選手都有關(guān)系

      娛樂要聞

      鏢人反超驚蟄無聲拿下單日票房第二!

      財經(jīng)要聞

      一覺醒來,世界大變,特朗普改新打法了

      汽車要聞

      比亞迪的“顏值擔當”來了 方程豹首款轎車路跑信息曝光

      態(tài)度原創(chuàng)

      數(shù)碼
      時尚
      本地
      房產(chǎn)
      軍事航空

      數(shù)碼要聞

      英特爾Bartlett Lake-S系列處理器陣容曝光:全大核、睿頻5.9GHz

      2026紐約秋冬時裝周,在春天開啟美的新故事!

      本地新聞

      春花齊放2026:《駿馬奔騰迎新歲》

      房產(chǎn)要聞

      窗前即地標!獨占三亞灣C位 自貿(mào)港總裁行宮亮相

      軍事要聞

      硬核揭秘!福建艦“一馬當先”底氣何在

      無障礙瀏覽 進入關(guān)懷版