4月16日,Anthropic正式發(fā)布Claude Opus 4.7。這是目前最強的公開可用大模型,重點升級了三件事:復(fù)雜任務(wù)執(zhí)行能力、視覺理解能力、長鏈路工作流穩(wěn)定性。
簡單來說,它能自主完成更復(fù)雜的任務(wù),不需要你盯著它;它能看懂更高清的圖片、表格、截圖;它在執(zhí)行長鏈條任務(wù)時不容易掉鏈子。
也就是說很多原本需要人來做的工作,現(xiàn)在可以交給它了。一夜之間,一大批公司的護城河,可能就這么沒了。
![]()
一、Claude Opus 4.7能力大躍升
1、編碼能力,跨越式提升
先看數(shù)字。SWE-bench Verified從80.8%升到87.6%,漲了近7個百分點。SWE-bench Pro從53.4%升到64.3%,漲了將近11個百分點,直接超過GPT-5.4(57.7%)和Gemini 3.1 Pro(54.2%)。
CursorBench從58%升到70%,Terminal-Bench 2.0從65.4%升到69.4%,命令行操作、DevOps任務(wù)、終端調(diào)試都更穩(wěn)了。
![]()
2、視覺能力,分辨率漲了3倍
Opus 4.7支持最長邊2576像素的圖片輸入,約等于3.75兆像素,是之前Claude模型的3.3倍以上。XBOW的視覺精度測試從54.5%飆到98.5%,幾乎是翻倍。新增了xhigh effort級別,位于high和max之間。
3、長任務(wù),更穩(wěn)了
在長上下文任務(wù)上,Opus 4.7在六個研究模塊的綜合評分達到0.715,并列第一,被評測方描述為"所有被測模型中長上下文表現(xiàn)最穩(wěn)定的"。
多步驟復(fù)雜工作流比Opus 4.6提升14%,同時工具調(diào)用錯誤率降低了三分之一。
![]()
價格方面,保持不變。輸入5美元/百萬token,輸出25美元/百萬token,和Opus 4.6完全一樣。開啟prompt緩存最多省90%,批處理API省50%。
二、接下來,一大批公司要倒閉了
Anthropic官方說了,以下領(lǐng)域提升最明顯:開發(fā)者、分析師、法務(wù)、研究人員,以及所有高頻處理文檔、表格、演示材料的人。
以下幾類公司,要認真想想了。
1、傳統(tǒng)軟件公司
還在用“古法編程”的公司,壓力最大。Opus 4.7能獨立解決超過六成的真實GitHub工程問題,跨語言、跨代碼庫。
一個高級工程師加上Claude Opus 4.7,能干一個小團隊的活。代碼審查、Bug修復(fù)、功能開發(fā)、測試編寫,全鏈路都能覆蓋。
不是轉(zhuǎn)不轉(zhuǎn)型的問題,轉(zhuǎn)型速度稍慢一些,就會被對手干掉。
2、數(shù)據(jù)分析和調(diào)研機構(gòu)
還在靠人頭堆數(shù)據(jù)分析的機構(gòu),將直接被替代。Opus 4.7在Finance Agent基準(zhǔn)上達到64.4%,是當(dāng)前最高分。多步驟金融分析、建模、專業(yè)報告生成,它都能做。
一個分析師加上AI,現(xiàn)在能處理以前需要一個團隊才能完成的工作量。調(diào)研報告、數(shù)據(jù)清洗、圖表解讀、競品分析,速度快、成本低、不需要加班。
3、傳統(tǒng)咨詢公司
傳統(tǒng)咨詢公司賣的是什么?方法論、行業(yè)知識、分析框架。
AI時代,這些東西不稀缺了。Opus 4.7的GPQA Diamond得分94.2%,接近博士級推理水平。大量的行業(yè)知識和分析方法,它都能調(diào)用。
客戶不會再為“知識本身”付錢,他們要的是端到端交付,要的是按結(jié)果付費。
Palantir是一個值得參考的模式,它嵌入客戶的業(yè)務(wù)流程,幫客戶把數(shù)據(jù)變成決策,按結(jié)果收費。這種模式在AI時代反而更有競爭力。
4、傳統(tǒng)律師事務(wù)所
法律工作的核心是什么?文件審查、合同分析、案例研究、風(fēng)險判斷。Opus 4.7的長上下文能力和文檔推理能力,正好對準(zhǔn)這些場景。1M token的上下文窗口,能裝下整本合同、整個案卷。
初級律師做的大量重復(fù)性工作,現(xiàn)在可以被自動化。還在靠人頭計費的事務(wù)所,競爭力會快速下滑。
三、傳統(tǒng)公司,AI正在踢門
對于企業(yè)來說,轉(zhuǎn)型不是選項,是必須的。AI能力每隔幾個月就跳一個臺階。企業(yè)如果不主動轉(zhuǎn)型成AI Native公司,不把AI能力嵌入核心業(yè)務(wù)流程,就會越來越難滿足市場的速度和成本要求。
但不是說,轉(zhuǎn)型就沒事了,轉(zhuǎn)不好一樣完蛋。
看看多鄰國就知道了,2023年到2025年初,多鄰國股價漲了666%,靠的是AI驅(qū)動的內(nèi)容生產(chǎn)和用戶增長敘事。但隨后不到一年,股價跌了超過80%。
原因就是,為了追求短期增長,多鄰國大規(guī)模裁減內(nèi)容創(chuàng)作者,用AI批量生成課程內(nèi)容。結(jié)果是內(nèi)容質(zhì)量下滑,用戶體驗變差,留存率下降,增長數(shù)據(jù)開始難看,資本市場的信心隨之崩塌。
為了AI而AI,犧牲了體驗,增長只是短期的,崩塌才是必然的。
AI轉(zhuǎn)型的核心邏輯始終是:用戶需要什么,就用AI去更好地滿足它。不是反過來,先有AI,再去找用戶需求。拿著錘子找釘子,死路一條。
AI能做的就是放大企業(yè)和個人的能力邊界,企業(yè)AI轉(zhuǎn)型但無論怎么轉(zhuǎn),有一件事不會變:真正滿足用戶的新需求、為用戶創(chuàng)造價值的公司,才能活下去。AI只是加速了這個篩選過程,僅此而已。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.