<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      AlphaGo之父出山:另辟蹊徑,繞過大模型探索超級智能

      AlphaGo之父出山探索超級智能

      0
      分享至

      又一位大佬創(chuàng)業(yè)了。

      幾周前,消息確認前谷歌 DeepMind 首席科學家、AlphaGo 核心負責人戴維·席爾瓦(David Silver)正式離職,并在倫敦創(chuàng)立人工智能初創(chuàng)公司"Ineffable Intelligence"。據(jù)悉,該公司正在推進一輪規(guī)模達 10 億美元的種子輪融資,目前已接近完成。

      這一融資額度,追平了 OpenAI 前首席科學家伊利亞·蘇茨克維(Ilya Sutskever)2024 年創(chuàng)立 Safe Superintelligence(SSI)時創(chuàng)下的紀錄。


      圖 | 戴維·席爾瓦 (來源:Youtube)

      與當前依賴海量文本預訓練的大模型路徑不同,席爾瓦的新公司明確提出:他們要繞過 LLM 既定范式,回歸強化學習(Reinforcement Learning, RL)本源,構(gòu)建一個不依賴人類既有知識、能自主探索新知的智能系統(tǒng)。

      作為 DeepMind 聯(lián)合創(chuàng)始人德米斯·哈薩比斯(Demis Hassabis)自大學時代的密友與長期合作伙伴,席爾瓦的離開可以說是該公司歷史上最重要的人事變動之一。DeepMind 發(fā)言人在簡短聲明中確認了這一消息:“戴維的貢獻是無價的,我們非常感謝他對 DeepMind 工作所做出的貢獻。”

      席爾瓦不僅是技術(shù)標桿,更是強化學習路線的堅定倡導者。作為圖靈獎得主查理·薩頓(Charlie Sutton)的學生,他的論文被引用量已超過 28 萬次,并于 2019 年獲得 ACM 計算獎。

      他主張回歸強化學習的核心思路。2025 年 4 月,席爾瓦與其導師薩頓共同發(fā)表論文《歡迎來到經(jīng)驗時代》(Welcome to the Era of Experience),提出新一代 AI 系統(tǒng)應更注重智能體與環(huán)境的交互學習:通過持續(xù)試錯、自我迭代和長期互動積累經(jīng)驗,而非僅依賴靜態(tài)數(shù)據(jù)訓練。這一理念,也是 Ineffable Intelligence 的技術(shù)基石。


      (來源:arXiv)

      在當前創(chuàng)投環(huán)境下,Ineffable Intelligence 高達 10 億美元的融資目標尤為引人注目。接近交易的投資人分析,資本市場愿意為一家尚未發(fā)布產(chǎn)品的公司開出如此巨額支票,主要基于兩點:一是對席爾瓦個人技術(shù)聲望的信任,二是對其所主張的“后大模型時代”技術(shù)路線的戰(zhàn)略性押注。

      目前,包括 OpenAI 的 GPT 系列與谷歌的 Gemini 系列在內(nèi),主流 AI 模型均建立在“預訓練 + 微調(diào)”范式之上。這些模型通過學習互聯(lián)網(wǎng)上海量的文本數(shù)據(jù),掌握預測下一個詞的統(tǒng)計規(guī)律,從而展現(xiàn)出強大的對話與生成能力。但席爾瓦認為,這一路徑存在本質(zhì)局限:AI 的能力上限被“人類數(shù)據(jù)”本身所鎖定。

      席爾瓦曾在私下場合多次表達對當前技術(shù)路線的擔憂。他指出,大語言模型在后訓練階段主要依賴“人類反饋強化學習”(RLHF),即通過人類評估員的打分來優(yōu)化模型。這意味著,模型所能達到的最高水平,難以超越人類評估員的認知邊界。

      “我們想要超越人類的認知,為此需要一種不同的方法。”2025 年 4 月,席爾瓦在一檔播客節(jié)目中罕見公開闡述其理念,“這種方法需要 AI 能夠真正自主探索,發(fā)現(xiàn)人類尚不知道的新事物。”

      Ineffable Intelligence 的核心愿景,正是構(gòu)建一個擺脫人類知識束縛的系統(tǒng)。據(jù)熟悉該項目的人士透露,新公司將致力于研發(fā)“能夠持續(xù)學習的超級智能”——它不僅能處理語言,更能通過在模擬環(huán)境中的自我博弈與試錯,從第一性原理出發(fā),推導解決問題的最優(yōu)解。

      席爾瓦的堅持,有扎實的成果支撐。作為 AlphaGo 總設(shè)計師,他主導了 2016 年那場轟動全球的人機大戰(zhàn)。在與李世石的第二局比賽中,著名的“第 37 手”曾被所有人類專家判定為失誤,因為它不符合任何已知圍棋定式。然而后續(xù)棋局證明,這正是決定勝負的關(guān)鍵一手。席爾瓦將此類現(xiàn)象稱為“不可言說”(Ineffable)的智慧。AI 通過計算,發(fā)現(xiàn)了人類尚未掌握的規(guī)律。這也正是新公司名稱的由來。


      (來源:Google Deepmind)

      此后,席爾瓦團隊開發(fā)的 AlphaZero 與 MuZero 進一步驗證了其理論:AlphaZero 在不依賴任何人類棋譜、僅被告知規(guī)則的前提下,通過自我對弈三天便擊敗 AlphaGo;MuZero 甚至無需知曉規(guī)則,就能在圍棋、國際象棋和 Atari 游戲中自主摸索規(guī)律,達到超人水平。

      這些成果構(gòu)成了席爾瓦技術(shù)路線的基石:在規(guī)則明確、可模擬的系統(tǒng)中,純粹的強化學習完全有能力超越人類智能。他堅信,只要設(shè)計出合理的獎勵機制,AI 就能在更復雜的現(xiàn)實任務中復刻 AlphaZero 的成功,無需像大語言模型那樣,通過模仿人類語言來“假裝”思考。

      席爾瓦的創(chuàng)業(yè),也折射出 AI 研究圈正在經(jīng)歷一場“路線大分流”。

      隨著大語言模型在商業(yè)應用中的普及,越來越多頂尖科學家開始擔憂技術(shù)發(fā)展的潛在瓶頸。2024 年,OpenAI 前首席科學家伊利亞·蘇茨克維創(chuàng)辦 Safe Superintelligence(SSI),同樣獲得巨額融資。盡管 SSI 與 Ineffable Intelligence 均以“超級智能”為目標,但側(cè)重點有所不同:伊利亞傾向于通過擴大計算規(guī)模與優(yōu)化模型結(jié)構(gòu)實現(xiàn)智能躍遷,席爾瓦則更激進地主張改變學習范式,由“監(jiān)督學習”轉(zhuǎn)向“強化學習”。

      此外,一些曾參與 AlphaGo、AlphaZero 項目的科學家,近期也離職創(chuàng)辦了 Reflection AI;Meta 的人工智能部門則在圖靈獎得主楊立昆(Yann LeCun)帶領(lǐng)下,重組“超級智能實驗室”,探索不同于 Transformer 架構(gòu)的新路徑。

      一位行業(yè)觀察家指出:“當前局面頗似 2010 年代初深度學習爆發(fā)前夜。大家意識到,現(xiàn)有 LLM 雖強大,但可能并非通往 AGI 的終極答案。席爾瓦代表最原教旨主義的一派,他認為智能的本質(zhì)是決策與探索,而非語言預測。”

      不過,也有批評者指出,強化學習雖在圍棋、游戲等規(guī)則明確的環(huán)境中表現(xiàn)優(yōu)異,但在現(xiàn)實世界這類規(guī)則模糊、反饋稀疏的開放環(huán)境中,其有效性尚未得到充分驗證。大語言模型之所以成功,正因語言本身是人類智慧的高度壓縮。通過學習語言,AI 能以較低成本獲得常識。

      若完全摒棄這一路徑,Ineffable Intelligence 或需構(gòu)建極其復雜的數(shù)字孿生系統(tǒng),供 AI 進行億萬次試錯訓練,其算力成本將是天文數(shù)字。這也正是 10 億美元融資需要解決的首要問題。

      目前,Ineffable Intelligence 已在倫敦設(shè)立總部,并啟動全球頂尖強化學習研究員的招募。雖然公司尚未公布具體產(chǎn)品時間表,但這家公司的技術(shù)路線與資源投入,或?qū)⒊蔀橛绊?AI 技術(shù)演進方向的下一股重要力量。

      1. https://www.ft.com/content/dffe72d0-4064-4412-8ebc-50198a30d40e

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      33.9萬!火鍋店稱把春節(jié)4天盈利分給員工,老板:去年關(guān)了兩家店 但春節(jié)福利要堅持

      33.9萬!火鍋店稱把春節(jié)4天盈利分給員工,老板:去年關(guān)了兩家店 但春節(jié)福利要堅持

      紅星新聞
      2026-02-21 10:12:08
      摔倒被扶反索賠22萬后續(xù):律師發(fā)聲,案件焦點已明,賠償跑不掉了

      摔倒被扶反索賠22萬后續(xù):律師發(fā)聲,案件焦點已明,賠償跑不掉了

      愛下廚的阿釃
      2026-02-21 06:55:42
      東北大媽偷菜謊稱山東人后續(xù):弟弟單位同事證明,臉都丟盡了

      東北大媽偷菜謊稱山東人后續(xù):弟弟單位同事證明,臉都丟盡了

      離離言幾許
      2026-02-20 15:57:01
      伊朗已經(jīng)下定決心,搶在美國動手之前,把俄羅斯牢牢綁在戰(zhàn)車上

      伊朗已經(jīng)下定決心,搶在美國動手之前,把俄羅斯牢牢綁在戰(zhàn)車上

      東極妙嚴
      2026-02-20 15:17:46
      貝加爾湖事故遇難者遺體已被發(fā)現(xiàn),涉事司機為44歲當?shù)啬凶樱邓较陆訂危猾@救者是來自江蘇省的一位男性

      貝加爾湖事故遇難者遺體已被發(fā)現(xiàn),涉事司機為44歲當?shù)啬凶樱邓较陆訂危猾@救者是來自江蘇省的一位男性

      都市快報橙柿互動
      2026-02-21 00:08:59
      痛心!樹齡1200年古樟持續(xù)燃燒7小時,只因倆小孩隨手扔爆竹……

      痛心!樹齡1200年古樟持續(xù)燃燒7小時,只因倆小孩隨手扔爆竹……

      環(huán)球網(wǎng)資訊
      2026-02-21 10:22:16
      拾石村媽祖被替后續(xù): 女孩賬號曝光,當了八年被選定,今年滿18歲

      拾石村媽祖被替后續(xù): 女孩賬號曝光,當了八年被選定,今年滿18歲

      離離言幾許
      2026-02-20 14:02:55
      王濛表態(tài):只要祖國需要,我隨時到場,敢簽保2塊金牌的生死狀

      王濛表態(tài):只要祖國需要,我隨時到場,敢簽保2塊金牌的生死狀

      風過鄉(xiāng)
      2026-02-21 09:09:53
      劃水雙巨全打瘋!東契奇首節(jié)17+4+4三分 約基奇19+3三分

      劃水雙巨全打瘋!東契奇首節(jié)17+4+4三分 約基奇19+3三分

      醉臥浮生
      2026-02-21 11:51:03
      22歲小伙長發(fā)大波浪回家被外甥叫阿姨

      22歲小伙長發(fā)大波浪回家被外甥叫阿姨

      觀威海
      2026-02-21 10:14:32
      中國游客貝加爾湖溺亡7人,1人來自深圳,目擊者稱2、3分鐘就沉了

      中國游客貝加爾湖溺亡7人,1人來自深圳,目擊者稱2、3分鐘就沉了

      九方魚論
      2026-02-21 01:34:21
      阿富汗是這個世界的好老師

      阿富汗是這個世界的好老師

      名人茍或
      2026-02-20 09:01:37
      第5枚金牌今夜18點45分!CCTV5直播,金牌榜反超日本隊看混合團體

      第5枚金牌今夜18點45分!CCTV5直播,金牌榜反超日本隊看混合團體

      老吳說體育
      2026-02-21 08:58:41
      毛奇、李佩霞2026年近況公布,兩人服刑結(jié)局給所有人提了醒

      毛奇、李佩霞2026年近況公布,兩人服刑結(jié)局給所有人提了醒

      娛樂督察中
      2026-02-21 03:23:47
      貝加爾湖底的七名中國游客,本來是可以不用死的

      貝加爾湖底的七名中國游客,本來是可以不用死的

      未來展望
      2026-02-21 00:23:41
      古巴高調(diào)反美!美國為啥不打古巴?因為古巴是最“先進”的國家

      古巴高調(diào)反美!美國為啥不打古巴?因為古巴是最“先進”的國家

      南宮一二
      2026-01-10 17:41:19
      女子除夕夜在洗浴中心浴池門口被人錄像,洗浴中心稱公共區(qū)域直播很正常,律師:公共區(qū)域未經(jīng)允許直播同樣涉嫌侵權(quán)

      女子除夕夜在洗浴中心浴池門口被人錄像,洗浴中心稱公共區(qū)域直播很正常,律師:公共區(qū)域未經(jīng)允許直播同樣涉嫌侵權(quán)

      大象新聞
      2026-02-20 21:52:07
      哈登18+8加盟全勝!騎士險勝黃蜂豪取7連勝 米切爾32分克努33分

      哈登18+8加盟全勝!騎士險勝黃蜂豪取7連勝 米切爾32分克努33分

      醉臥浮生
      2026-02-21 10:31:52
      2月20日俄烏最新:無比強硬的停火條件

      2月20日俄烏最新:無比強硬的停火條件

      西樓飲月
      2026-02-20 20:02:11
      “趕緊還錢!”關(guān)稅政策被判違法后,加州州長呼吁美政府立即“連本帶利”退還稅款

      “趕緊還錢!”關(guān)稅政策被判違法后,加州州長呼吁美政府立即“連本帶利”退還稅款

      環(huán)球網(wǎng)資訊
      2026-02-21 09:38:25
      2026-02-21 12:12:49
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      16294文章數(shù) 514626關(guān)注度
      往期回顧 全部

      科技要聞

      智譜上市1月漲5倍,市值超越京東、快手

      頭條要聞

      7名中國游客貝加爾湖遇難:冰面裂縫約3米 在打撈遺體

      頭條要聞

      7名中國游客貝加爾湖遇難:冰面裂縫約3米 在打撈遺體

      體育要聞

      冬奧第一"海王"?一人和13國選手都有關(guān)系

      娛樂要聞

      鏢人反超驚蟄無聲拿下單日票房第二!

      財經(jīng)要聞

      一覺醒來,世界大變,特朗普改新打法了

      汽車要聞

      比亞迪的“顏值擔當”來了 方程豹首款轎車路跑信息曝光

      態(tài)度原創(chuàng)

      健康
      時尚
      藝術(shù)
      教育
      親子

      轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

      2026紐約秋冬時裝周,在春天開啟美的新故事!

      藝術(shù)要聞

      史洪生油畫作品

      教育要聞

      母親的愛有什么特點?很多人抱怨這件事

      親子要聞

      專家稱試管嬰兒壽命僅40年,首例試管嬰兒今何在?

      無障礙瀏覽 進入關(guān)懷版