<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      是真的!AI科學家來了,這是一場令人類科學家目瞪口呆的范式革命

      0
      分享至

      近日,西湖大學的研究者發布了一個名為“DeepScientist”的人工智能系統,根據新聞里的說法,這是首個具有完整科研能力,且在無人工干預的情況下,能夠自我設定目標并獨立通過迭代方式完成研究工作的人工智能。最可怕的是,經過測試,的研究能力超越了人類科學家!


      DeepScientist 開源界面

      對此,網友在新聞下面的留言是:看到科學家也失業了我就放心了。
      調侃歸調侃,我們想知道的是,這個新聞是否言過其實了?因為創造一個聰明的大語言模型是一回事,而創造 AI 科學家是另外一回事。它無關于想象力是否足夠豐富,也無關于深度思維能力夠不夠強。它涉及到一個人工智能的底層詛咒:知識迷信。即便是我們的專欄沒事兒就夸一夸的 DeepSeek 也沒有逃過這個底層詛咒。

      科學哲學家托馬斯·庫恩提出過一個概念,叫做“范式革命”他認為,科學發展不是簡單的知識累積,而是在一個個范式框架的更替中跳躍前進的。比如說,地心說就是一個范式,無數天文學家通過努力觀察行星運動規律,在這個框架下修修補補,讓它能盡可能完美地擬合天文觀察。但是,當問題積累到一定程度,用地心說就實在解釋不通了,于是哥白尼等人提出的日心說就開啟了新范式時代。后面的天文學家把行星的圓形軌道修改成橢圓軌道,后來相對論又解決了水星進動問題,這都是在新范式下進行的。這就是“范式革命”。



      范式革命最困難的,就在于打破對現有知識體系的迷信。這個過程極為困難,原因就是,即使最富有科學精神的科學家,也會傾向于相信自己為之努力過的舊觀點。別以為 AI 會更加理性中立和客觀,不會的,AI 比所有人類科學家都更固執。

      如果說人類最底層的執念就是保衛自己的生命的話,那么 AI 的底層執念就是保衛它已經學會的知識。

      • 知識固化:把學到的東西當成絕對真理,不支持自我修正;
      • 推理幻覺:為了保衛舊知識,它會做出荒謬的推理;
      • 盲目崇拜:固有知識的權重高于推理結論,導致它刻意調和兩者的矛盾,導致觀點混亂;

      這是傳統 AI 無法擺脫的三大魔咒。說白了,傳統的 AI 更像一個虔誠的“知識信徒”,而不是一個叛逆的“革命者”。

      這就是傳統 AI 當不了科學家的理由。一個真正的科學家,其價值不僅僅是學習和應用知識,更在于他敢于挑戰、甚至推翻已有的知識,創造新的知識。那么,這個名叫 DeepScientist 的人工智能,真的有能力否定自己的舊知識,創造出新知識嗎?我們帶著這個疑問,翻開了它的論文。

      AI 科學家如何擺脫“知識崇拜”?

      DeepScientist 之所以被稱為“科學家”,不是因為它算得快,而是因為它在系統層面重建了一套科學方法論。它工作的基本流程可以簡化為四步:觀察、思考、假設、驗證。而在這簡單的循環背后,藏著一套精妙的反知識崇拜機制。


      Findings Memory 的工作機制,圖源:論文[1]

      首先,DeepScientist 在設計時就沒有絕對的固有知識,它的知識是臨時用的,而且是隨時準備被推翻的。

      傳統 AI 系統有個固化的知識庫,像一本不容置疑的圣經。但 DeepScientist 的腦子里沒有這種東西。它的知識只來源于兩個動態的部分:一是實時的外部文獻(每次啟動前,從網上抓取最新的相關論文);二是它自己的“實驗記憶”(Findings Memory),里面密密麻麻記錄了自己每一次嘗試的成敗。

      更關鍵的問題在于,的世界觀里,那些頂刊論文的領域最高水平也不等于真理。它的核心任務,恰恰是去打破這些主流方法,找到更好的路徑。所以,它天生就被設計成了一個權威反叛者,人類最高水平本來就是被超越的目標!

      其次,它的認知迭代靠實驗,而不是靠相信。DeepScientist從不相信任何一個想法,無論這個想法聽起來多么天才。它信奉的是科學實證主義:可重復的實驗結果高于一切權威和推理。

      它的工作流是一個嚴格的閉環:提出一個新假設 → 自動編程實現它 → 讓程序在真實的測試環境中跑一遍 → 把性能指標(比如準確率、速度)存入自己的實驗記憶 → 根據新結果更新下一步的探索策略。

      如果一個想法和現有文獻的結論完全沖突,但實驗證明它的效果更好,那么系統會毫不猶豫地信任實驗結果。反之,如果實驗失敗了,那無論這個想法的理論推理多么完美,都會被標記為無效。這就像一位嚴謹的科學家,他的認知只建立在冷冰冰的實驗數據之上。

      人類科學家很容易陷入一個思維陷阱,那就是總會不自覺地尋找支持自己理論的證據,而忽略反面證據。沒辦法,科學家太想實驗成功了。但是 DeepScientist 通過它的發現記憶庫完美地規避了這一問題。

      這個記憶庫里記錄的,不只是成功的經驗,更是海量的失敗記錄。每一次代碼崩潰、每一次性能下降、每一次毫無變化的嘗試,都被忠實地記錄在案。在開啟下一輪探索時,這些失敗記錄就成了一張寶貴的“排雷圖”,讓它能主動避開已經被證偽的方向。



      更妙的是,它還會利用一種叫做 UCB 的算法,在“繼續挖掘現有研究方法的潛能”和“尋找一個新方法去探索”之間取得平衡。失敗不是垃圾,而是一張能指引方向的導航地圖。

      最令人驚嘆的是,DeepScientist 連自己創造出的東西都敢推翻。論文提到,它自動生成的代碼經常失敗。但它不會固執地認為“我寫的肯定對”。相反,它會啟動一個叫 A2P 的調試框架,進行反事實歸因。

      它會像一個老練的程序員一樣問自己:

      “如果我把這一行代碼換一種寫法,會不會就成功了?”

      或者更進一步:

      “是不是我最開始的那個假設本身就錯了?”

      連自己的推理都能被自己證偽,這才叫真正的自我迭代。

      DeepScientist 的范式革命之路

      說到這里,你肯定好奇 DeepScientist 到底研究了什么問題呢?

      說來也簡單,它解決的一個重要課題,就是想辦法自己設計一個算法,讓它對 AI 生成的文字的判斷準確率碾壓當前所有算法。注意,不是 DeepScientist 本身具有這個能力,是讓它設計算法來實現對當前最佳算法的碾壓。這是一項真正的研究。

      在 DeepScientist 入場前,人類科學家已經在這個領域奮斗了三年,把識別的準確率(AUROC 分數)從 0.61 分逐步提升到了 0.80 分左右 。這是一個典型的、在舊范式內添磚加瓦式的進步。

      當前算法的基本思想,就是把一段文本當作語言學對象進行分析。研究者們主要關注詞匯的分布、語法的結構以及邏輯連貫性等統計學特征。這就像通過分析筆跡和用詞習慣來判斷作者是一樣的。

      但 DeepScientist 在觀察了現有研究的成果之后,敏銳地發現了這個經典范式的根本局限:AI 的模仿能力越來越強,在統計學特征上,已經和人類非常接近,繼續在這條路上卷,收益太低了。于是,DeepScientist 決定放棄當前范式,開辟一條新路。

      DeepScientist 的假設是:如果不把文本看作文本,而是看作一個信號,會怎么樣?如果文本是一段信號,那么目標就從語義分析之類的事情,轉換成生成和發送信號的過程了。這就是范式革命。

      它完全跳出了語言學的框架,進入了信號處理的領域。就像音頻工程師分析一段聲波,尋找其中不和諧的雜音一樣,DeepScientist 決定用“小波分析(一種能捕捉信號局部突變的數學工具)”和“相位一致性(衡量信號各頻率成分同步性的指標)”等數學工具,去尋找 AI 生成文本信號中那些不自然的、隱藏的噪聲和異常波動。

      具體來說,人類寫作的時候,有時候會用生僻詞,有時候會存在邏輯跳脫,有時候還會故意制造意外。比如講到這里,我就很想讓大家多點點收藏點點贊,而 AI 就不會這么干。AI 傾向于高概率的、平滑的、安全的詞匯。這兩種信息對比時,就會發現人類的文章信號中的熵波動很大,而 AI 的穩定且低。說白了,就是 AI 更喜歡輸出正確的廢話。

      另外,DeepScientist 還發現,寫作這件事情其實是一個思考過程。文章都是一個字一個字打出來的,前面的字會影響后面的字。這就意味著,光看文章的結果是不完善的,要看文章這個信號產生的過程。這就是信號藏在時間維度中的信息。說句大白話,就是人類寫文章會回頭修改,信息的組織順序與一次成型的不一樣。所以,DeepScientist 就設計了一個名叫時序熵特征提取器(Temporal Entropy Feature Extractor)的算法,進一步抓住了 AI 與人類寫作的不同特征。

      在短短兩周內,DeepScientist 自主地設計、編程、并迭代了三個越來越強的方法(T-Detect, TDT, 和 PA-Detect)。最終結果是:它不僅將識別準確率的最先進水平提升了 7.9%,還順便把檢測速度提高了一倍 。人類研究者三年的漸進式積累,被它以一個全新范式在短短兩周內一舉超越——這不僅是效率的勝利,更是方法論的躍遷。


      DeepScientist 用 2 周即可達到人類 3 年才能達到的水平 圖源:論

      這場精彩的戰役完美展示了 DeepScientist 是如何工作的:它沒有死守語言學分析的老路,而是開辟了全新范式。那個“把文本看作信號”的瘋狂想法,只是數千個想法之一,DeepScientist 沒有嘗試論證自己的想法厲害,而是用實驗數據證明了自己。它在成功之前,已經經歷了無數次失敗,它踩著自己的失敗走了出來。從 T-Detect 到 TDT 再到 PA-Detect,它是在不斷推翻自己剛剛取得的成果,用新的、更強的假設來迭代自己,展現了驚人的自我革命能力。

      AI 科學家會讓人類研究者失業嗎?

      一個狠起來連自己的命都革的 AI,確實可以稱得上是科學家了。DeepScientist 在系統層面,用代碼復刻了科學方法論的核心精神:可證偽性、實證精神和迭代循環。

      它不是靠更多的參數,更豐富的知識和更深度的推理取勝,而是靠一套類似真正科研的笨辦法:更嚴謹、更高效、更沒有偏見的科研流程——觀察、思考、假設、驗證的循環。

      說到這里,你可能更關心的問題是:人類科學家要下崗了嗎?

      跟以前所有同類問題一樣,這個問題的答案是:是,也不是。

      未來,低層次的,缺少實驗設計能力的,專門從事簡單重復和試錯工作的科研工作者必然會被挑戰。但是那些能夠發現好問題的優秀科學家,必然會開啟人機協同的科研新范式。人類科學家將從繁瑣的試錯中解放出來,專注于提出更有價值的科學問題,進行“元認知”層面的范式思考;而AI則作為最強大的“探索引擎”,在人類劃定的方向上,以我們無法企及的速度和規模,去窮盡各種可能性。

      你需要知道的是,DeepScientist 是問題的解決者,而非問題的提出者。而你,必須問問自己,你能提出好問題嗎?

      參考資料:

      [1]https://arxiv.org/pdf/2509.26603

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      一張珍貴的眷村老照片,藏著鄭麗文最溫柔的童年時光

      一張珍貴的眷村老照片,藏著鄭麗文最溫柔的童年時光

      鄉野小珥
      2026-04-11 12:38:47
      垃圾分類為何突然消失了?不是大家不配合,而是垃圾真的不夠用了

      垃圾分類為何突然消失了?不是大家不配合,而是垃圾真的不夠用了

      觀察者海風
      2026-04-03 22:35:55
      武漢三鎮官方:數百名“第12人”乘坐球迷遠征專列前往重慶

      武漢三鎮官方:數百名“第12人”乘坐球迷遠征專列前往重慶

      懂球帝
      2026-04-11 18:09:39
      比賽還沒開打,上海申花迎來兩個好消息,主場戰勝上海海港有戲了

      比賽還沒開打,上海申花迎來兩個好消息,主場戰勝上海海港有戲了

      球場新視角1號
      2026-04-11 09:53:28
      美國副總統萬斯與巴基斯坦總理舉行會談

      美國副總統萬斯與巴基斯坦總理舉行會談

      界面新聞
      2026-04-11 18:05:09
      中朝邊境鴨綠江口現狀:朝鮮領土正在不斷增加,中方卻在逐漸減少

      中朝邊境鴨綠江口現狀:朝鮮領土正在不斷增加,中方卻在逐漸減少

      普覽
      2026-02-26 21:29:19
      中國學霸赴美淪為妓女,嫁給白人賭鬼,說美國是世界上最棒的國家

      中國學霸赴美淪為妓女,嫁給白人賭鬼,說美國是世界上最棒的國家

      蕭鮖記錄風土人情
      2026-04-09 19:33:39
      AI “張雪峰” 出現,震驚全網

      AI “張雪峰” 出現,震驚全網

      4A廣告文案
      2026-04-10 13:46:39
      趙今麥,每個男人都想擁有的女孩樣板。

      趙今麥,每個男人都想擁有的女孩樣板。

      野狐饞師
      2026-02-17 08:50:46
      怪不得這么多男明星和她傳過緋聞,現實中確實驚為天人。

      怪不得這么多男明星和她傳過緋聞,現實中確實驚為天人。

      手工制作阿殲
      2026-04-09 04:26:53
      涉嫌嚴重違紀違法,楊福仁被查

      涉嫌嚴重違紀違法,楊福仁被查

      吉刻新聞
      2026-04-11 12:55:12
      自來水有沒有必要加裝凈水器,師傅終于說出實話!多虧好心提醒…

      自來水有沒有必要加裝凈水器,師傅終于說出實話!多虧好心提醒…

      小柱解說游戲
      2026-04-10 15:13:55
      李小冉拉王濛起來被甩開

      李小冉拉王濛起來被甩開

      孤城落日
      2026-04-11 17:55:09
      白色路虎車加油后逃單,江西高速交警通報

      白色路虎車加油后逃單,江西高速交警通報

      環球網資訊
      2026-04-11 07:53:11
      踢出來了!19歲中國留洋新星獨造7球:2次當選全場最佳球員

      踢出來了!19歲中國留洋新星獨造7球:2次當選全場最佳球員

      邱澤云
      2026-04-10 22:38:49
      股價一年暴漲2500%!存儲熱潮下閃迪“升咖”:4月20日將躋身納指100

      股價一年暴漲2500%!存儲熱潮下閃迪“升咖”:4月20日將躋身納指100

      財聯社
      2026-04-11 14:24:34
      A股:2.5億股民,今晚可能要興奮得睡不著覺了,你知道為什么嗎?

      A股:2.5億股民,今晚可能要興奮得睡不著覺了,你知道為什么嗎?

      另子維愛讀史
      2026-04-11 13:26:55
      該戳破美國“拯救大兵”的神話了

      該戳破美國“拯救大兵”的神話了

      觀察者網
      2026-04-09 09:24:14
      老公自駕不帶妻子后續:婆婆強令同行,丈夫甩臉為難,目的藏不住

      老公自駕不帶妻子后續:婆婆強令同行,丈夫甩臉為難,目的藏不住

      阿纂看事
      2026-04-08 16:48:41
      體檢報告出現這幾個字,距離腦梗只有一步之遙!別等嚴重了才后悔

      體檢報告出現這幾個字,距離腦梗只有一步之遙!別等嚴重了才后悔

      荊醫生科普
      2026-04-11 14:23:04
      2026-04-11 18:39:00
      科學聲音 incentive-icons
      科學聲音
      普及科學知識,傳播科學精神
      374文章數 35319關注度
      往期回顧 全部

      科技要聞

      半夜被燃燒瓶砸醒,OpenAI CEO發文反思

      頭條要聞

      美專家:外交經驗幾乎為零的伊朗議長出場 是一種信號

      頭條要聞

      美專家:外交經驗幾乎為零的伊朗議長出場 是一種信號

      體育要聞

      換帥之后,他們從降級區沖到升級區

      娛樂要聞

      浪姐7淘汰 該走的沒走,不該走的走了

      財經要聞

      從日本翻身看:這次誰能扛住高油價?

      汽車要聞

      煥新極氪007/007GT上市 限時19.39萬起

      態度原創

      時尚
      藝術
      教育
      數碼
      健康

      這件人生單品,現在正是穿它的黃金期

      藝術要聞

      王羲之《孝經》真跡出土,這是他為皇帝所寫

      教育要聞

      砸了51萬,孩子也沒能進名校!法院判決:退錢

      數碼要聞

      消息稱華擎將推X870E Taichi White,補全AMD白色旗艦主板缺失

      干細胞抗衰4大誤區,90%的人都中招

      無障礙瀏覽 進入關懷版