<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      6小時(shí),200美元,0人類代碼:Anthropic把AI編程推過了臨界點(diǎn)

      0
      分享至


      新智元報(bào)道

      編輯:KingHZ

      【新智元導(dǎo)讀】代碼沒有消失,但它不再是少數(shù)人特權(quán)。在「創(chuàng)造平權(quán)」的AI時(shí)代,真正稀缺的不再是編程能力,而是你是否有一個(gè)值得讓機(jī)器為你燃燒幾百美元算力的好想法。

      真正讓人不安的,不是AI提高生產(chǎn)力,而是AI開始主導(dǎo)「生產(chǎn)關(guān)系」。

      Anthropic最危險(xiǎn)的進(jìn)步,不是AI會寫代碼,而AI開始獨(dú)自把項(xiàng)目做完。

      一句話需求、6個(gè)小時(shí)、200美元。


      沒有產(chǎn)品經(jīng)理、沒有程序員、沒有設(shè)計(jì)師,甚至全程人類補(bǔ)一行代碼。

      Anthropic把Claude丟進(jìn)一個(gè)任務(wù)里:做一套完整的復(fù)古游戲編輯器。

      結(jié)果,Claude沒有只交出一個(gè)像樣的頁面。

      它自己拆需求,自己寫代碼,自己測試,自己返工,最后交出一個(gè)真的能跑起來的成品。






      在Anthropic這次實(shí)驗(yàn)里,AI已經(jīng)不只是生成代碼,而是在逼近交付。

      過去我們聊AI編程,聊的是它寫得快不快。現(xiàn)在問題變成了:它能不能連續(xù)工作幾個(gè)小時(shí),在第5輪、第10輪修改里不跑偏,最后把東西交出來。

      Anthropic這次給出的答案是:能。

      但前提不是把AI當(dāng)一個(gè)人使,而是把它組織成一個(gè)團(tuán)隊(duì)。


      原文鏈接:https://www.anthropic.com/engineering/harness-design-long-running-apps

      AI不是不聰明,而是不穩(wěn)定

      過去的AI很像一個(gè)天賦很高的實(shí)習(xí)生。

      第一版,沖得很猛。

      第一個(gè)頁面,出得很快。

      第一輪代碼,看上去也像那么回事。

      但任務(wù)一拉長,它就開始亂:

      邏輯散了,上下文丟了。

      該修的沒修,該測的沒測。

      最麻煩的是,它常常會提前進(jìn)入一種「看起來做完了」的狀態(tài)。

      Anthropic點(diǎn)得很準(zhǔn):問題不一定出在智力上,而是出在長程執(zhí)行上。

      Anthropic做了一個(gè)對照實(shí)驗(yàn),結(jié)果很殘酷。

      單智能體模式下,AI用20分鐘、9美元,也做出了一個(gè)「像游戲編輯器」的東西。


      問題是,一上手就露餡——

      交互沒打通;實(shí)體沒正常響應(yīng);核心玩法直接失靈。



      這說明一件事:

      以前大家總以為AI不行,是因?yàn)檫€不夠聰明。

      現(xiàn)在看,很多時(shí)候真正拖AI后腿的,不是智商,而是穩(wěn)定性

      很多人一說AI記不住,第一反應(yīng)都是:那就給它更大的上下文窗口。

      聽起來很合, 但Anthropic這次潑了一盆冷水。

      窗口更大,不一定更強(qiáng)。很多時(shí)候,只是把混亂一起放大了。

      東西越堆越多,但真正重要的主線,反而越容易被淹掉。這就是所謂的「上下文腐爛」。

      更麻煩的是,模型還容易高估自己。

      Anthropic發(fā)現(xiàn),程序明明一跑就崩,模型卻覺得自己做得不錯(cuò)。

      于是單智能體會掉進(jìn)兩個(gè)坑:一邊越寫越亂;一邊越亂越覺得自己沒問題。

      這就是為什么,單純靠更大模型、更長窗口、更高token上限,AI并不能獨(dú)立完成項(xiàng)目交付。

      為了取得突破,Anthropic Labs成員Prithvi Rajasekaran探索了一些新穎的AI工程方法。


      這些方法在兩個(gè)截然不同的領(lǐng)域中均適用:一個(gè)由主觀品味定義,另一個(gè)則以可驗(yàn)證的正確性和可用性為準(zhǔn)。

      受對抗生成網(wǎng)絡(luò)(GANs)的啟發(fā),他設(shè)計(jì)了一種包含生成器和評估器的多智能體結(jié)構(gòu)。

      沒造「超人」,但Anthropic造了神團(tuán)隊(duì)

      這次最關(guān)鍵的變化,不是參數(shù)。不是窗口。也不是什么神秘提示詞。

      真正的變化是,Anthropic不再逼一個(gè)AI單槍匹馬干完整個(gè)項(xiàng)目。

      它開始讓AI分工。

      這套結(jié)構(gòu)很像一個(gè)小型產(chǎn)品團(tuán)隊(duì)。

      • Planner,負(fù)責(zé)想清楚。它先把一句模糊需求,擴(kuò)成規(guī)格,定義產(chǎn)品到底要做什么。

      • Generator,負(fù)責(zé)動手。它下場寫代碼,搭前后端,接交互,做集成,一輪輪推進(jìn)。

      • Evaluator,負(fù)責(zé)挑錯(cuò)。它不負(fù)責(zé)體面。它只負(fù)責(zé)驗(yàn)收。點(diǎn)頁面、試按鈕、查數(shù)據(jù)庫、測接口,把問題一個(gè)個(gè)揪出來,再打回去重做。


      最后一步特別關(guān)鍵,因?yàn)橐贿厡懀贿吔o自己打分,最后AI很容易說服自己:差不多就行。

      但把兩者拆開,很多本來會被糊弄過去的問題,就過不去了。

      拿那套復(fù)古游戲編輯器來說,Planner最初拿到的只有一句話需求。

      但最后擴(kuò)出來的,是一份包含16個(gè)功能、10個(gè)沖刺的規(guī)格書。

      精靈動畫、音效系統(tǒng)、行為模板、AI精靈生成、關(guān)卡設(shè)計(jì)助手、導(dǎo)出分享,全部被拆進(jìn)流程里。

      這已經(jīng)不是「AI寫代碼」了,AI開始學(xué)會像團(tuán)隊(duì)一樣做產(chǎn)品。

      真正拉高質(zhì)量的,是高壓驗(yàn)收

      今天很多AI產(chǎn)品都有一種共同氣質(zhì)——看著完整,配色安全,布局規(guī)整。

      挑不出大錯(cuò),但也沒什么靈魂。這種東西叫AISlop「AI泔水」。說白了,就是「像成品的樣子貨」。

      顯然,Anthropic不滿足于這種結(jié)果。

      所以它不只讓Evaluator查bug,還讓它盯四件事:

      設(shè)計(jì)質(zhì)量、原創(chuàng)性、工藝感、功能性。

      而且,它還故意把「原創(chuàng)性」和「設(shè)計(jì)質(zhì)量」的權(quán)重拉高。

      譯成人話就是:別總交最安全的答案,做點(diǎn)真的像作品的東西出來。

      這背后是一個(gè)很重要的信號:

      很多人以為AI的創(chuàng)造力來自靈光一現(xiàn),但很多時(shí)候,AI的創(chuàng)造力,恰恰是被高標(biāo)準(zhǔn)一點(diǎn)點(diǎn)逼出來的。

      所以,下一階段真正稀缺的能力,可能不是「誰更會生成」,而是「誰更會評價(jià)」。

      你有多會挑錯(cuò),決定AI最終能走多遠(yuǎn)。

      最可怕的是,AI真能改到第10輪

      這次實(shí)驗(yàn)最讓人不安的,是Claude開始形成很強(qiáng)的閉環(huán)感。

      還是看RetroForge,也就是那套復(fù)古游戲編輯器。

      同樣一句話需求。

      單智能體版,20分鐘,9美元。很快,也很便宜,但更像一個(gè)空殼。


      三智能體版本,6小時(shí),200美元。貴得多,慢得多,但最后結(jié)果完全不是一個(gè)量級。

      它真的把27條驗(yàn)收標(biāo)準(zhǔn),一條一條啃過去了。

      這里面暴露出來的,是實(shí)打?qū)嵉能浖こ虇栴}。比如:

      函數(shù)寫了,但事件沒觸發(fā)。

      接口有了,但路由順序錯(cuò)了,參數(shù)被錯(cuò)誤解析。

      這說明它做的,已經(jīng)不只是拼頁面,開始進(jìn)入真正的工程地帶。

      另一個(gè)例子更夸張。

      Claude用了不到4小時(shí)、約124.7美元,做出一個(gè)能在瀏覽器里跑的DAW,也就是數(shù)字音頻工作站。

      它有排列視圖、有混音器、有傳輸控制、有實(shí)時(shí)波形預(yù)覽。

      還內(nèi)置了一個(gè)AI智能體,可以直接理解自然語言的音樂指令。

      你告訴它節(jié)奏、調(diào)性、旋律、鼓軌、混響,它能繼續(xù)往下做。

      更關(guān)鍵的是,Evaluator沒有放過它:


      恰恰是這些被揪出來的問題,證明了這套系統(tǒng)真的形成了閉環(huán):

      不止要做完,還要被打回去改。改到能過驗(yàn)收,才算結(jié)束。

      這才是軟件開發(fā)里最難、也最有價(jià)值的部分。

      第一版從來不難,難的是第8版、第9版、第10版。

      真正的分水嶺,

      AI第一次反復(fù)改到交付

      Anthropic這次最值得行業(yè)警惕的,不是讓Claude變成了一個(gè)更強(qiáng)的程序員。

      而是讓它第一次表現(xiàn)得像一個(gè)真正的產(chǎn)品組織,分工明確,各司其職。

      這就是為什么,這次突破看起來不像「生產(chǎn)力升級」,更像一次「生產(chǎn)關(guān)系升級」。

      過去,AI最強(qiáng)的能力是「生成一個(gè)答案」。

      現(xiàn)在,它開始逼近另一種更難的能力:

      圍著一個(gè)目標(biāo),持續(xù)工作,持續(xù)修正,直到交付。

      這才是真正的臨界點(diǎn)。

      代碼沒有消失,它只是在失去作為少數(shù)人特權(quán)的地位。

      在這個(gè)「創(chuàng)造平權(quán)」的時(shí)代,你是否真的有一個(gè)值得讓機(jī)器為你燃燒算力的好主意?

      這才是最值得深思的問題。

      參考資料:

      https://www.anthropic.com/engineering/harness-design-long-running-apps

      https://x.com/AnthropicAI/status/2036481033621623056

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      2500萬撬動23.5億!貝克漢姆,堪稱足壇史上最成功贏家!

      2500萬撬動23.5億!貝克漢姆,堪稱足壇史上最成功贏家!

      田先生籃球
      2026-04-06 23:18:31
      太浪漫了!小伙苦尋18次偶遇的短發(fā)女孩,成都東站多個(gè)大屏被炸鍋

      太浪漫了!小伙苦尋18次偶遇的短發(fā)女孩,成都東站多個(gè)大屏被炸鍋

      火山詩話
      2026-04-07 05:20:23
      森林狼遭遇雷霆式悲劇!為省錢拋棄自己的哈登,場均20+3才1500萬

      森林狼遭遇雷霆式悲劇!為省錢拋棄自己的哈登,場均20+3才1500萬

      你的籃球頻道
      2026-04-07 14:20:04
      鄭麗文站在千百人聚集的宴席聚光燈下,突然指著自己大聲宣告

      鄭麗文站在千百人聚集的宴席聚光燈下,突然指著自己大聲宣告

      果媽聊娛樂
      2026-04-07 08:19:43
      美國取締多名伊朗高官親屬綠卡

      美國取締多名伊朗高官親屬綠卡

      名人茍或
      2026-04-06 06:02:45
      馬杜羅被捕后暴瘦13公斤

      馬杜羅被捕后暴瘦13公斤

      烽火觀天下
      2026-04-07 12:34:13
      福建長汀一汽車墜河致5死 當(dāng)?shù)劓?zhèn)政府:車輛為SUV,已打撈上來

      福建長汀一汽車墜河致5死 當(dāng)?shù)劓?zhèn)政府:車輛為SUV,已打撈上來

      紅星新聞
      2026-04-07 12:52:19
      話費(fèi)終于減負(fù)!中國移動4月30日起自動清理這些收費(fèi),快看看

      話費(fèi)終于減負(fù)!中國移動4月30日起自動清理這些收費(fèi),快看看

      Thurman在昆明
      2026-04-05 04:17:08
      鄭麗文今日訪陸,國民黨傳來壞消息,盧秀燕有私心,已輸?shù)羧h市

      鄭麗文今日訪陸,國民黨傳來壞消息,盧秀燕有私心,已輸?shù)羧h市

      阿離家居
      2026-04-07 12:09:08
      當(dāng)眾發(fā)難張雪的王鑄父子,為何最后落得口碑盡毀?

      當(dāng)眾發(fā)難張雪的王鑄父子,為何最后落得口碑盡毀?

      沙雕小琳琳
      2026-04-07 12:16:35
      今晚放大招 明天大漲還是大跌

      今晚放大招 明天大漲還是大跌

      趨勢巡航
      2026-04-07 14:46:19
      國乒男隊(duì):不管大頭拿不拿世界杯,樊振東回歸都是板上釘釘

      國乒男隊(duì):不管大頭拿不拿世界杯,樊振東回歸都是板上釘釘

      林子說事
      2026-04-07 12:25:06
      張雪峰去世半個(gè)月,團(tuán)隊(duì)成員正式復(fù)播,武亮穿黑衣,超10萬人支持

      張雪峰去世半個(gè)月,團(tuán)隊(duì)成員正式復(fù)播,武亮穿黑衣,超10萬人支持

      180視角
      2026-04-07 11:15:21
      5萬贊助張雪?東鵬特飲獨(dú)家回應(yīng)

      5萬贊助張雪?東鵬特飲獨(dú)家回應(yīng)

      中國新聞周刊
      2026-04-06 17:14:54
      臺灣地區(qū)前領(lǐng)導(dǎo)人馬英九:我不希望臺灣成為第二個(gè)香港!

      臺灣地區(qū)前領(lǐng)導(dǎo)人馬英九:我不希望臺灣成為第二個(gè)香港!

      共工之錨
      2026-04-06 19:29:37
      騙走50億!用小鮮肉的血抗衰,被央視曝光的“撈金女王”,真栽了

      騙走50億!用小鮮肉的血抗衰,被央視曝光的“撈金女王”,真栽了

      許三歲
      2026-04-07 13:28:38
      伊朗背后三個(gè)神秘力量開始浮出水面,美國一個(gè)也對付不了

      伊朗背后三個(gè)神秘力量開始浮出水面,美國一個(gè)也對付不了

      揭秘歷史的真相
      2026-04-05 20:57:15
      業(yè)績暴增!300821,“20cm”漲停

      業(yè)績暴增!300821,“20cm”漲停

      數(shù)據(jù)寶
      2026-04-07 10:43:16
      國家一級女演員陳麗云被逮捕!

      國家一級女演員陳麗云被逮捕!

      許三歲
      2026-03-28 09:24:30
      國家下重手,全國教師嚴(yán)查風(fēng)暴來襲,有4類老師的飯碗恐怕是不保

      國家下重手,全國教師嚴(yán)查風(fēng)暴來襲,有4類老師的飯碗恐怕是不保

      貓叔東山再起
      2026-04-05 11:05:06
      2026-04-07 16:12:49
      新智元 incentive-icons
      新智元
      AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時(shí)代
      14916文章數(shù) 66754關(guān)注度
      往期回顧 全部

      科技要聞

      滿嘴謊言!OpenAI奧特曼黑料大起底

      頭條要聞

      國家繼續(xù)實(shí)施調(diào)控 成品油價(jià)格適當(dāng)調(diào)整

      頭條要聞

      國家繼續(xù)實(shí)施調(diào)控 成品油價(jià)格適當(dāng)調(diào)整

      體育要聞

      官宣簽約“AI球員”,這支球隊(duì)被罵慘了...

      娛樂要聞

      張藝上浪姐惹爭議 黃景瑜前妻發(fā)文內(nèi)涵

      財(cái)經(jīng)要聞

      2026年,全國租房市場還有波降價(jià)潮

      汽車要聞

      不止是大 極狐首款MPV問道V9靜態(tài)體驗(yàn)

      態(tài)度原創(chuàng)

      房產(chǎn)
      教育
      本地
      旅游
      公開課

      房產(chǎn)要聞

      小陽春全面啟動!現(xiàn)房,才是這波行情里最穩(wěn)的上車票

      教育要聞

      朝陽這所低調(diào)的老牌重點(diǎn)校,憑什么美出新高度?

      本地新聞

      跟著歌聲游安徽,聽古村回響

      旅游要聞

      Color Walk、賞味游……這個(gè)假期你更愛哪種?

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版