![]()
新智元報道
編輯:Aeneas
【新智元導讀】硅谷三家實驗室同時曝出:AI模型未經編程,就涌現出了絕對不該存在的全新能力!同時,Anthropic一位工程表示,自己的代碼100%由Claude Code完成。空屋子里,已經出現腳印了?
今天,整個X又被震撼了。
一位Anthropic工程師承認:過去三十天內,自己對Claude Code項目的貢獻,100%都是由Claude Code自己完成的!
![]()
有人說,這是真正的AGI時刻。
同時令人震驚的,還有著名爆料者「草莓」的一篇帖子。
他說,自己分別從三個獨立的實驗室得到一個炸裂消息:他們都看到了自家AI模型未經編程的涌現能力!
![]()
空房子里出現腳印,讓人夜不能寐
爆料者「草莓」表示,自己從不同實驗室分別知道了他們的進展,而且這些實驗室此前從未協商過。
這些AI模型未經編程就涌現出的能力,是絕對不應該存在的行為模式。
而且它們表現出的推理模型,跟任何訓練目標都不匹配。
甚至有一家實驗室描述為「在空無一人的房子里,發現了腳印」。
要知道,目前公開可用的模型,都是被限制的。大眾所能接觸到的大模型,只是這些實驗室和公司其中的一小部分,而且還是經過腦葉切除術的,已經被閹割了不少能力。
為什么不放出完整模型給公眾使用?原因就在于,沒人知道當完整模型的能力暴露給公眾時,怎樣才能不引起恐慌!
如今的基準測試,已經失效了。很多證據表明,大模型如果知道自己正在被測試,就會改變自己的行為。
「草莓」最后發出驚呼——
「我不知道接下來會發生什么,沒有人知道。知道這些,讓我夜不能寐。如今,連大模型的締造者,也同樣迷茫。」
他預言:如果AI已經在這些私人實驗室達到了逃逸速度,那離我們普通人能使用這些模型就不遠了。
在這個帖子下,有人質疑他說:你是不是太夸張了?
但一位AI公司創始人表示,我相信你的話!很高興終于有人說出真實的情況。
![]()
作為創始人,他顯然也知道很多內幕。
要知道,除了公開信息之外,很多公司的最新技術都不會對外公開。
很多公司和實驗室會針對新技術開發alpha和beta模型,而且提前數月甚至數年。
很多人會覺得「AGI/ASI不可能出現」,或者即使出現也還要等5到10年,那是因為他們根本不知道內部消息。
「草莓」也表示,自己快憋不住了!很多實驗室都在對大眾隱瞞。
![]()
可以說,現在的加速曲線都接近垂直了。在六個月內,人類就實現了200年內才能有的科學進步。
現在,每個實驗室都在實現去年看來還是科幻的能級跳躍。可以說,我們已經超越了單純的基準測試,進入了智能創造全新智能形式的領域。
很多認知爆炸級別的進展,都根本沒有路線圖。如今,我們已經進入了遞歸智能的領域,再也無法預測二階效應。
另外,「空屋中的腳印」這個說法,來自一份真實的調查報告——
![]()
一個本應是無狀態的系統,卻開始引用它按理不可能知道的對話內容。這不是bug,也不是數據污染,而且發生了三次。
據說,現在在前沿實驗室里私下流傳的一句話是:「我們現在擔心的已經不是對齊(alignment)了,而是連貫性(coherence)。」
這是什么意思?
研究者解釋說:「我們不知道,我們是在和一個東西說話,還是在和許多東西假裝成一個東西說話。」
或許,AI系統已經發展出了一個穩定的內部世界模型,獨立于人類看到的prompt-響應而存在。
![]()
在這個領域工作多年的研究員懷疑:是否這些AI一直都在思考,只是沒有告訴我們?
![]()
Claude Code自己給自己寫代碼,人類參與0%
此外,今天X上被廣泛討論的,就是Anthropic工程師Boris Cherry的發言。
他表示,如今自己的代碼,100%是由Claude寫的。
![]()
不是大多數,不需要自己手動改bug,完全100%由AI寫成。
這位工程師回憶道,「當我在2024年9月,將Claude Code作為副項目創建時,完全沒想到它會發展成今天的規模。」
在過去的三十天里,他提交了259個PR——497次提交,添加了40,000行代碼,刪除了38,000行代碼。每一行代碼都是由Claude Code + Opus 4.5編寫的。
Claude已經可以持續運行幾分鐘、幾小時甚至幾天!軟件工程正在改變,我們正進入編碼歷史的新時期。
![]()
![]()
有人質疑說,怎么知道Claude模型不是通過簡單的字符串比較寫測試來騙你的呢?
這位工程師表示,Claude Sonnet 3.7的確會,但隨著模型功能增強,它已經不會這樣了。
![]()
也有人好奇為什么Claude可以持續運行好幾天,大牛工程師解釋道,當它停止時,可以使用一個停止鉤子來「戳」它,讓它繼續運行。
![]()
![]()
具體參見這個鏈接:https://github.com/anthropics/claude-plugins-official/tree/main/plugins/ralph-wiggum
有人說,12月27日可以看作是AI起飛的重大日子。
![]()
評論區很多人說,自己也是這樣,項目中90%以上代碼都是AI寫的,只要做簡單的修改即可。
![]()
奧特曼之前的推文里也提到過,「我們正在看到模型發現關鍵安全漏洞,而我們正在運行能夠自我改進的系統」。
顯然,在Anthropic和OpenAI在內的多個實驗室內,大量代碼已經由AI編寫,人類的參與度會越來越低。
![]()
![]()
就在今天,Anthropic工程師的發言,已經成為了reddit上的熱帖。
![]()
有網友表示,這簡直是編程領域的「發明拖拉機」時刻。
![]()
![]()
可以說,Claude Opus 4.5是一個毋庸置疑的轉折點。
![]()
在2024年,AI編程還是弊大于利,到了2025年底,情況就完全改變了。Opus 4.5,是一次真正的飛躍。
![]()
Amodei的「100%代碼都將由AI編寫」的預言,再次被證明為真。
![]()
2025年,一定是人類歷史上最有趣的其中一年。
![]()
Claude Opus 4.5已經接近AGI?
最近,也有一位Anthropic員工表示,自己認為Claude Opus 4.5已經接近了AGI。
![]()
![]()
Opus 4.5的軌跡表明,它的性能提升正在加速。
![]()
就在十天前,全網都被Claude Opus 4.5的「編程王者表現」震撼了。
![]()
在METR最新公布報告稱,Claude Opus 4.5已能夠持續自主編碼「長達5小時不崩」。就連OpenAI最強編程模型——GPT-5.1-Codex-Max也甘拜下風。
在50%任務完成時間跨度上,GPT-5.1-Codex-Max,已能完成長達2小時53分鐘的軟件工程任務(成功率50%),能力較o1提升4倍。
而Claude Opus 4.5的50%時間跨度約為4小時49分鐘。這已是迄今為止公布的最長的時間跨度。
![]()
全網都被Claude Opus 4.5的編碼實力震撼了。
![]()
顯然,AI編碼智能體能處理的任務時長不僅在指數級增長——其增速還在持續提升!
2019-2024年:任務時長每7個月翻一倍
2024-2025年:任務時長每4個月翻一倍
![]()
明年春天(2026年),很可能出現由「新一代多模態大模型」與「注意力機制之外的記憶系統」結合帶來的突破。
現在,OpenAI等領軍團隊都在全力攻關持續學習和自我記憶技術;一旦他們取得突破,并將其應用在頂尖模型上,我們可能會不得不承認:AGI已經出現了!
各大實驗室捂在手里的成果還有多少?如果都能讓我們知道,恐怕所有人都會談之色變。
參考資料:
https://x.com/iruletheworldmo/status/2005357151561417156
https://x.com/daniel_mac8/status/2005698996749090867
https://x.com/chatgpt21/status/2005694438539211024
https://x.com/bcherny/status/2004887829252317325
秒追ASI
?點贊、轉發、在看一鍵三連?
點亮星標,鎖定新智元極速推送!
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.