<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

      Claude Opus 4.5來了:谷歌把Anthropic逼到了墻角

      0
      分享至

      上周,Google實(shí)在是太猛了,拳打OpenAI,腳踢Anthropic。Gemini 3 Pro模型在編程、數(shù)學(xué)、推理等能力上都達(dá)到了當(dāng)之無愧的SOTA級(jí)別。


      被逼到墻角之后,就看誰先有能力掀桌坐不住了。

      于是,就在今天,Anthropic發(fā)布了Claude Opus 4.5。


      Opus 4.5的核心還是聚焦在編程能力,可以說很炸裂:SWE-bench Verified達(dá)到80.9%,首次突破80%,超越Gemini 3 Pro的76.2%。


      以及,很少見的是,他們甚至降價(jià)了!價(jià)格從之前的貴得離譜的$15/$75直接降到$5/$25 per million tokens,直降66%!!

      Opus 4.5的發(fā)布,說明Anthropic是真的急了——或者說,終于認(rèn)真了。

      Opus 4.5到底有多強(qiáng)?

      先說benchmark數(shù)據(jù)。

      SWE-bench Verified:80.9%

      這是業(yè)界公認(rèn)的編程能力測試標(biāo)準(zhǔn)。Opus 4.5是第一個(gè)突破80%的模型。

      對比一下:

      - Gemini 3 Pro:76.2%

      - Claude Sonnet 4.5:77.2%

      - GPT-5.1:76.3%/77.9%

      80.9%是什么概念?Anthropic內(nèi)部拿性能工程師的面試題測試,Opus 4.5的得分超過了所有人類候選人。


      Terminal-bench 2.0:59.3%

      這個(gè)測試主要看模型在終端環(huán)境下的編程能力。Opus 4.5比Gemini 3 Pro高了5個(gè)百分點(diǎn)(54.2%),比自家的Sonnet 4.5高了近10個(gè)百分點(diǎn)(50.0%)。

      這個(gè)差距說明一個(gè)事實(shí):Claude在真實(shí)開發(fā)環(huán)境下,就是比其他模型強(qiáng)。

      GPQA Diamond:87.0%

      這是研究生級(jí)別的推理測試,涵蓋物理、化學(xué)、生物。Opus 4.5在這個(gè)測試上落后于Gemini 3 Pro(91.9%),但87%的成績也不差。

      總結(jié)一下:編程能力世界第一,推理能力也不弱。

      價(jià)格策略的巨大轉(zhuǎn)變

      Opus 4.5最讓人意外的,是在性能提升的同時(shí),價(jià)格還暴降了。

      新定價(jià):

      - 輸入:$5 / million tokens

      - 輸出:$25 / million tokens

      Anthropic的官方說法是:"making Opus-level capabilities accessible to even more users, teams, and enterprises"(讓更多用戶、團(tuán)隊(duì)和企業(yè)能用上Opus級(jí)別的能力)。

      邏輯很明顯:Anthropic需要更多人用Opus。

      之前Opus的定位是"高端用戶",但高端市場就那么大。現(xiàn)在降價(jià),是要搶占"中端市場"——那些之前用Sonnet,但其實(shí)需要更強(qiáng)能力的開發(fā)者。

      不到一周,正面交鋒

      11月18日,Google發(fā)布Gemini 3 Pro。

      11月24日,Anthropic發(fā)布Claude Opus 4.5。

      不到一周,兩個(gè)頂級(jí)模型連續(xù)發(fā)布。

      這不是巧合。

      Gemini 3 Pro發(fā)布時(shí),各種benchmark數(shù)據(jù)都很炸裂,尤其是GPQA Diamond的91.9%,直接刷新了推理能力的記錄。當(dāng)時(shí)AI圈的共識(shí)是:Google這次真的起來了。


      Anthropic當(dāng)然不會(huì)讓Google獨(dú)占風(fēng)頭。

      Opus 4.5的發(fā)布時(shí)機(jī),明顯是沖著Gemini 3來的。而且,Anthropic選擇的戰(zhàn)場很聰明:不和你比推理,和你比編程。

      Gemini 3 Pro在推理上確實(shí)強(qiáng)(91.9% vs 87.0%),但在編程上,Claude Opus 4.5領(lǐng)先了近5個(gè)百分點(diǎn)(80.9% vs 76.2%)。

      更關(guān)鍵的是,編程能力是開發(fā)者最關(guān)心的指標(biāo)。推理能力再強(qiáng),如果寫不出好代碼,開發(fā)者也不會(huì)買單。

      這就是Anthropic的策略:在自己最擅長的領(lǐng)域,做到絕對領(lǐng)先。

      為什么Anthropic能在編程上這么強(qiáng)?

      之前我在測試Claude Code時(shí),有個(gè)很深的感受:

      Claude Code好用的邏輯,不是因?yàn)樗墙K端工具,而是因?yàn)锳nthropic有模型成本和模型認(rèn)知的優(yōu)勢。

      他們可以更無所畏懼地投喂代碼上下文燒token,能知道如何擠壓模型Agentic的能力實(shí)現(xiàn)更長步驟的推理,可以用agentic search而非RAG的方式處理上下文。

      這些優(yōu)勢,說白了就一個(gè)原因:Anthropic從一開始就是奔著編程和Agent去優(yōu)化模型的。

      我之前評(píng)價(jià)Claude 4時(shí)說:最強(qiáng)編程模型 + 最強(qiáng)Agent基建。

      Anthropic對模型的所有優(yōu)化,都是奔著To B做AI coding和讓開發(fā)者建agent而去的。他們主要做了這幾個(gè)方面的優(yōu)化:

      1. 擴(kuò)展思維與工具使用:允許模型在思考和使用工具之間來回切換,形成"思考-執(zhí)行-再思考"的循環(huán)

      2. 改進(jìn)的記憶能力:可以創(chuàng)建和維護(hù)"記憶文件"來存儲(chǔ)關(guān)鍵信息,支持長時(shí)間任務(wù)

      3. 更強(qiáng)的指令遵循能力:可以處理超過10000個(gè)token的系統(tǒng)提示

      4. 減少獎(jiǎng)勵(lì)黑客行為:模型為了達(dá)到目標(biāo)而走捷徑的傾向降低了80%以上

      這些優(yōu)化,放在Opus 4.5上,效果更明顯了。

      相比之下,Gemini 3的優(yōu)勢在于多模態(tài)。如果你的任務(wù)涉及視覺、圖片、視頻,Gemini 3會(huì)更強(qiáng)。但如果是純編程任務(wù),Claude Opus 4.5幾乎沒有對手。

      產(chǎn)品層面的配合

      Opus 4.5的發(fā)布,不是孤立的。

      Anthropic同時(shí)推出了幾個(gè)重要的產(chǎn)品更新:

      1. Claude Code進(jìn)入桌面端:支持并行運(yùn)行多個(gè)本地和遠(yuǎn)程會(huì)話,長對話自動(dòng)總結(jié)早期上下文

      2. Claude for Chrome:擴(kuò)展至所有Max用戶

      3. Claude for Excel:面向所有Max、Team和Enterprise用戶正式發(fā)布

      這些產(chǎn)品更新,都是在強(qiáng)化一個(gè)信號(hào):Claude不只是一個(gè)聊天模型,它是一個(gè)生產(chǎn)力工具。

      尤其是Claude Code。

      我之前說過,從工具層面來說,從Cursor這種IDE圖形界面退回到Claude Code這種終端命令行工具,其實(shí)是個(gè)挺大的退步。但Claude Code之所以還是比Cursor好用,就是因?yàn)樗澈蟮哪P湍芰μ珡?qiáng)了。

      現(xiàn)在Opus 4.5出來了,Claude Code的優(yōu)勢會(huì)更明顯。

      而且,Anthropic還宣布了和Microsoft、NVIDIA的戰(zhàn)略合作:Claude擴(kuò)展至Azure平臺(tái),由NVIDIA提供算力支持。這意味著,Claude的To B布局在快速推進(jìn)。

      開發(fā)者該怎么選?

      最后說點(diǎn)實(shí)際的:如果你是開發(fā)者,該選Claude還是Gemini?

      我的建議是:

      選Claude Opus 4.5,如果你的任務(wù)主要是:

      • 純代碼編寫和調(diào)試

      • 后端邏輯和復(fù)雜推理

      • 長時(shí)間的編程任務(wù)(需要記憶和上下文管理)

      選Gemini 3 Pro,如果你的任務(wù)主要是:

      • 多模態(tài)任務(wù)(涉及圖片、視頻、視覺)

      • 前端、UI設(shè)計(jì)

      • 需要超強(qiáng)推理能力的研究級(jí)任務(wù) 如果預(yù)算夠,最好的辦法是:兩個(gè)都用。

      Claude處理編程,Gemini處理多模態(tài)。各取所長。

      我前兩天剛剛同時(shí)用Claude Code+Gemini 3 Pro,開發(fā)了一個(gè)有儀式感地記錄日常生活和靈感碎片的app「小票筆記 - Thermal」,在開發(fā)這款app時(shí),我的工作步驟和體驗(yàn)是:

      1)Gemini 3在生成和復(fù)刻前端效果上明顯表現(xiàn)更優(yōu)

      2)實(shí)際的開發(fā)和解決bug的過程,Claude Code還是比Cursor + Gemini 3 Pro,或者使用Antigravity的體驗(yàn),因?yàn)殚L程的編程能力還需要工具更好的工程化能力,以及模型更底層的編程能力。




      最后

      Opus 4.5的發(fā)布,不是孤立事件。

      它是Anthropic在編程和Agent這條路上的又一次發(fā)力,是對Gemini 3的正面回應(yīng),也是對自己商業(yè)化策略的調(diào)整。

      Anthropic這么跳,說明AI大模型的競爭進(jìn)入白熱化了。

      對開發(fā)者來說,這是好事。模型越來越強(qiáng),價(jià)格越來越低,工具越來越好用。

      接下來,看OpenAI怎么接招。

      當(dāng)然,如果你因?yàn)橛嗛喕蛘呔W(wǎng)絡(luò)問題不方便使用原版Claude Code的話,也歡迎試試我前段時(shí)間開發(fā)的GLM Code:

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      上月剛升任縣委書記,在大會(huì)上我就被排擠,我準(zhǔn)備開始干部調(diào)動(dòng)

      上月剛升任縣委書記,在大會(huì)上我就被排擠,我準(zhǔn)備開始干部調(diào)動(dòng)

      秋風(fēng)專欄
      2025-12-16 11:43:12
      中國已經(jīng)提前準(zhǔn)備好,開戰(zhàn)后的第一件事,就是廢掉美國的“星鏈”

      中國已經(jīng)提前準(zhǔn)備好,開戰(zhàn)后的第一件事,就是廢掉美國的“星鏈”

      桑啟紅原
      2025-12-18 11:53:14
      腎臟“清潔工”被找到,3種蔬菜常吃,給腎“洗洗澡”越吃越年輕

      腎臟“清潔工”被找到,3種蔬菜常吃,給腎“洗洗澡”越吃越年輕

      江江食研社
      2025-12-17 18:30:04
      半夜有人撬我家指紋鎖,我剛躲進(jìn)廁所報(bào)警,就聽見:指紋解鎖成功

      半夜有人撬我家指紋鎖,我剛躲進(jìn)廁所報(bào)警,就聽見:指紋解鎖成功

      懸案解密檔案
      2025-12-06 09:29:34
      53歲吳越自曝單身生活,為父母買上海大平層,坦言孤獨(dú)是一種福報(bào)

      53歲吳越自曝單身生活,為父母買上海大平層,坦言孤獨(dú)是一種福報(bào)

      好賢觀史記
      2025-12-16 17:01:31
      警察叔叔要換新裝了,對比之前8款,哪款是你喜歡的 “平安符號(hào)”

      警察叔叔要換新裝了,對比之前8款,哪款是你喜歡的 “平安符號(hào)”

      今朝牛馬
      2025-12-18 11:48:48
      鉆研18年沒評(píng)上高級(jí)工程師,遞交離職當(dāng)天,工廠收到 20個(gè)訂單取消

      鉆研18年沒評(píng)上高級(jí)工程師,遞交離職當(dāng)天,工廠收到 20個(gè)訂單取消

      眼淚博物
      2025-09-09 17:55:11
      被央視怒批、洋相百出、腹中空空,這幾位“絕望的文盲”憑啥能火

      被央視怒批、洋相百出、腹中空空,這幾位“絕望的文盲”憑啥能火

      娛說瑜悅
      2025-12-13 12:24:22
      融創(chuàng)中國約96億美元現(xiàn)有債務(wù)將獲全面解除及免除;11月房企債券融資規(guī)模同比增長近三成|房產(chǎn)早參

      融創(chuàng)中國約96億美元現(xiàn)有債務(wù)將獲全面解除及免除;11月房企債券融資規(guī)模同比增長近三成|房產(chǎn)早參

      每日經(jīng)濟(jì)新聞
      2025-12-18 07:05:54
      事態(tài)升級(jí)!解放軍對日改口,中方7字定性高市,日本搬出皇后求和

      事態(tài)升級(jí)!解放軍對日改口,中方7字定性高市,日本搬出皇后求和

      軍機(jī)Talk
      2025-12-16 11:40:40
      黎智英剛被定罪,28國就要施壓放人,中方態(tài)度堅(jiān)決,連提3個(gè)反對

      黎智英剛被定罪,28國就要施壓放人,中方態(tài)度堅(jiān)決,連提3個(gè)反對

      不似少年游
      2025-12-18 07:08:33
      黃坤明、懷進(jìn)鵬、孟凡利出席!清北交浙南復(fù)等17家高水平大學(xué),成立新聯(lián)盟

      黃坤明、懷進(jìn)鵬、孟凡利出席!清北交浙南復(fù)等17家高水平大學(xué),成立新聯(lián)盟

      TOP大學(xué)來了
      2025-12-17 16:09:02
      18萬債務(wù)9萬結(jié)清!網(wǎng)貸、信用卡“打折還貸”灰產(chǎn)調(diào)查:還款最低能打四折?

      18萬債務(wù)9萬結(jié)清!網(wǎng)貸、信用卡“打折還貸”灰產(chǎn)調(diào)查:還款最低能打四折?

      時(shí)代周報(bào)
      2025-12-18 09:02:19
      記者:蔣圣龍接受微創(chuàng)穿刺手術(shù),從腎臟部位抽出了6管積液

      記者:蔣圣龍接受微創(chuàng)穿刺手術(shù),從腎臟部位抽出了6管積液

      懂球帝
      2025-12-18 08:17:04
      一旦開戰(zhàn)中國必?cái)。课覈菏颗鲬?zhàn)派,要懂得甲午戰(zhàn)爭的慘敗

      一旦開戰(zhàn)中國必?cái)。课覈菏颗鲬?zhàn)派,要懂得甲午戰(zhàn)爭的慘敗

      文史旺旺旺
      2025-11-14 20:30:09
      大家發(fā)現(xiàn)沒有,這次中日沖突比歷次都嚴(yán)重,卻沒有人喊抵制日貨了

      大家發(fā)現(xiàn)沒有,這次中日沖突比歷次都嚴(yán)重,卻沒有人喊抵制日貨了

      詩意世界
      2025-12-15 08:30:02
      120元/晚的房間按390元/晚開票,職員出差85天“假公濟(jì)私”被開

      120元/晚的房間按390元/晚開票,職員出差85天“假公濟(jì)私”被開

      揚(yáng)子晚報(bào)
      2025-12-17 21:54:35
      龍虎局 4:斷腿之仇

      龍虎局 4:斷腿之仇

      金昔說故事
      2025-12-18 16:27:42
      事實(shí)證明,57歲的歌唱家張也,早已過上了另一種精彩人生

      事實(shí)證明,57歲的歌唱家張也,早已過上了另一種精彩人生

      豐譚筆錄
      2025-12-14 11:28:58
      三婚又要離了,他也太渣了。

      三婚又要離了,他也太渣了。

      二胡的歲月如歌
      2025-12-18 19:05:11
      2025-12-18 20:31:00
      AI進(jìn)化論花生 incentive-icons
      AI進(jìn)化論花生
      AI博主,AppStore付費(fèi)榜第一的小貓補(bǔ)光燈app開發(fā)者
      96文章數(shù) 40關(guān)注度
      往期回顧 全部

      科技要聞

      2025新一代人工智能創(chuàng)業(yè)大賽

      頭條要聞

      智力殘疾女孩遭4人侵犯懷孕父親討說法遇害 后續(xù)來了

      頭條要聞

      智力殘疾女孩遭4人侵犯懷孕父親討說法遇害 后續(xù)來了

      體育要聞

      巴黎首奪世界級(jí)冠軍 加冕6冠王比肩巴薩拜仁

      娛樂要聞

      絲芭放大招了!實(shí)名舉報(bào)鞠婧祎經(jīng)濟(jì)犯罪

      財(cái)經(jīng)要聞

      尹艷林:呼吁加快2.5億新市民落戶進(jìn)程

      汽車要聞

      在零下30℃的考場里 凡爾賽C5 X和508L拿到了"穩(wěn)"的證明

      態(tài)度原創(chuàng)

      教育
      時(shí)尚
      房產(chǎn)
      健康
      手機(jī)

      教育要聞

      “這樣廉價(jià)的母愛,還是別曬了”,家長給女兒補(bǔ)襪子,被網(wǎng)友群嘲

      “棕色大衣”今年冬天又火了,怎么搭都高級(jí)時(shí)髦

      房產(chǎn)要聞

      太強(qiáng)了!封關(guān)時(shí)刻,兩天砸下50億!央企綠發(fā),重倉三亞!

      這些新療法,讓化療不再那么痛苦

      手機(jī)要聞

      小屏機(jī)遇冷,消息稱2026年有兩家母系品牌計(jì)劃新增大屏旗艦機(jī)

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 1024国产基地| 丰满熟妇人妻中文字幕| 亚洲一区二区三区av无码| 成人丝袜激情一区二区| 亚洲精品国产字幕久久麻豆| 免费AV网站| aa性欧美老妇人牲交免费| 浓毛老太交欧美老妇热爱乱| 亚洲午夜精品久久久久久app| 无码欧洲| 青河县| 成人h动漫精品一区二区无码| 五月花成人网| 97在线碰| 亚洲第一av网站| 国产欧美精品一区二区三区| 天天爽夜夜爽夜夜爽| 亚洲欧美日韩中文字幕一区二区三区| 又大又粗又硬又爽黄毛少妇| 国内精品熟女亚洲精品熟女| 色欲人妻综合网站| 黄色高清无码| AV无码免费不卡在线观看| 波多野结衣无码视频一区二区三区| 亚洲中文字幕人妻| 久久久久久久久久久国产| 亚洲精品在线少妇内射| 91TS人妖另类精品系列| 国产精品久久无码一区| 欧美真人做爰在线观看| 色综合天天综合天天综| xxx日韩| 噜妇插内射精品| 日日夜夜精品| 黑人无码av| 色欲人妻无码| 少妇熟女久久综合网色欲| 边添小泬边狠狠躁视频| 精品3p| JIZZJIZZJIZZ亚洲日本| 人妻少妇精品中文字幕av蜜桃|