<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      李飛飛一年前究竟說了啥?怎么又火了

      0
      分享至

      聞樂 發自 凹非寺
      量子位 | 公眾號 QbitAI

      大語言模型的局限在哪里?

      AI教母李飛飛這樣說:

      大自然中是沒有語言存在的,你不會從天空中直接看到文字。
      語言是一種純粹的生成的信號。



      語言信號的輸出主要基于人類給的輸入信號,可以說,語言是不獨立于人之外的。

      然而,物理世界是客觀存在的。所以提取、理解、生成3D世界的數據、實現空間智能和處理語言問題時截然不同。



      沒想到,李飛飛一年前的訪談被扒出來,又引發大量圍觀。

      她這段話意味著,大語言模型或許還不是真正的智能。

      真正的智能將是信號感知、物理以及和現實世界相結合的產物。



      下面來看看大家還在熱議些啥吧。

      空間智能可以借鑒語言模型,但仍存在本質差異

      這場討論的焦點在于,現在基于語言信號訓練的模型到底懂不懂物理世界的常識

      首先,回顧一下李飛飛的說法。

      她認為語言模型及當今的多模態語言模型的底層表示是一維的。它們在根本上就是操作于離散token的一維序列上,所以模型對于書面文本這種一維序列的表示是非常自然的。



      然而,在處理空間智能問題時,核心是世界的三維本質。

      雖然多模態大語言模型也能看圖像,但它是將其他模態硬塞進這種一維token序列的底層表示中,這種一維且由人類生成的數據,可能無法很好地表示物理世界,造成信息損失。

      如果直接讓模型處理3D數據,那么表示類型與模型旨在執行的任務類型之間將會有更好的匹配。



      而空間智能的挑戰就是在于從這個真實世界中提取、表示和生成信息。

      除了這個維度上的差異,從更哲學的角度來說,她認為語言是一種純粹由生成產生的信號。自然界中并不存在預設的語言形式,也就是說語言不能獨立于人類之外。

      大模型能夠通過學習并反芻所輸入的數據,無論輸入什么樣的數據,模型都能用足夠的泛化能力處理語言任務。這是因為語言,或者說文本的本質允許模型在生成范式下表現得出色。



      與語言不同,3D世界是真實存在于外部的。這個世界遵循著物理定律,并因材料等多種因素而具有其自身的結構。

      因此,要讓模型倒推出3D世界的信息,并能夠表示和生成它,在技術層面上,空間智能可以借鑒語言模型,但從哲學的范疇來看,這兩者仍存在本質差異。



      有人舉了一堆例子來證明李飛飛的觀點,同時說明語言模型在理解物理世界時確實有局限。

      基于語言信號訓練的模型在物理世界任務中表現差

      比如用一個小實驗來測試Claude 3.5 Sonnet、GPT-4o、Gemini 1.5 Pro三個多模態大模型的物理常識,并與人類兒童表現做對比。



      研究用Animal-AI這個用來測試動物和人工智能體物理認知的3D環境來測試大模型,讓大模型通過前進/后退、左轉/右轉、環境描述與規劃控制三個指令控制一個小角色在虛擬環境中完成任務。



      第一個實驗是讓大模型完成一些簡單的任務,如直接找到小球,還有一些稍難的任務,如躲開障礙物找到小球。

      結果發現模型只能搞定最簡單的任務,稍難一點就不行了。

      第二個實驗是在第一個實驗的基礎上增加教學案例,比如演示正確做法,結果模型表現也沒有明顯的提升。

      對比之后再看,這些大模型的表現遠不及人類兒童,也比不上專門為這個環境測試的機器人。



      還有其他研究團隊設計了一個名為ABench-Physics的工具,專門用來測試大語言模型在物理推理方面的能力,核心就是想搞清楚這些模型到底能不能真的理解物理、解決物理問題。



      測試分兩部分,Phy A由400道競賽級別的物理難題組成,先給大模型來個基礎測試。

      Phy B屬于動態部分:修改Phy A中題目的數字,但不改變物理原理,用來測試大模型能不能進行靈活的物理推理。

      結果顯示,最厲害的模型在Phy A上的正確率只有43%,而在Phy B中模型的平均準確率下降了22.5%。

      這說明模型并不是真懂物理。



      還有團隊用視覺任務測試大模型,比如讓模型判斷照片中哪些物體更近,或者匹配相同的事物。

      人類對這些任務的正確率能達到95.7%,而幾個模型最高的正確率僅有51%。在視覺感知上,大模型還遠不及人類。



      這些結果都進一步證明了李飛飛之前訪談中關于大模型理解真實物理世界局限性的觀點。

      也得到了網友們的認同。



      模型的開發確實正在擴展到將模型建立在物理與多模態理解的基礎上。



      討論升級

      當然了,有正方就有反方。

      有人先是反駁了關于語言的論述。



      也有人認為,在某些情況下,語言描述現實的能力可能會比感知更優。



      還有人說模型的語言不用局限于人類的語言、文本等,人工智能或許能創造出自己的語言來理解物理世界。



      或者,我們該思考,用語言訓練大模型取得現有成就的根本因素又是什么呢?



      對于這場討論,你又有什么樣的看法呢?


      [1]https://x.com/rohanpaul_ai/status/1965242567085490547
      [2]https://www.youtube.com/watch?v=vIXfYFB7aBI

      — 完 —

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      郭士強帶14名球員出發!趙睿和胡明軒領銜,曾凡博徐杰因傷退出

      郭士強帶14名球員出發!趙睿和胡明軒領銜,曾凡博徐杰因傷退出

      體育哲人
      2026-02-22 19:44:38
      尼格買提8個家宴菜曝光!滿桌不見一片綠葉菜,背后身世藏不住了

      尼格買提8個家宴菜曝光!滿桌不見一片綠葉菜,背后身世藏不住了

      師維
      2026-02-23 12:31:35
      醫生,你正經點行嗎?盤點那些網友和醫護人員之間爆笑有趣的對話

      醫生,你正經點行嗎?盤點那些網友和醫護人員之間爆笑有趣的對話

      另子維愛讀史
      2026-02-22 21:23:33
      娜然跟霍啟山回香港!男友忙工作她逛街消費,娜然臉腫開始幸福肥

      娜然跟霍啟山回香港!男友忙工作她逛街消費,娜然臉腫開始幸福肥

      琴聲飛揚
      2026-02-23 11:43:07
      《鏢人》拿下中國影史春節檔武俠片冠軍

      《鏢人》拿下中國影史春節檔武俠片冠軍

      揚子晚報
      2026-02-22 15:42:16
      布朗:詹姆斯在我第一場首發過后,就和我說我能成為全明星

      布朗:詹姆斯在我第一場首發過后,就和我說我能成為全明星

      懂球帝
      2026-02-23 12:15:06
      年薪5300萬!火箭重金打造5號位,新中鋒單場21+4,勝過亞當斯?

      年薪5300萬!火箭重金打造5號位,新中鋒單場21+4,勝過亞當斯?

      熊哥愛籃球
      2026-02-23 12:49:40
      電影《飛馳人生3》 票房破19億 導演韓寒:甘孜太美,被深深震撼

      電影《飛馳人生3》 票房破19億 導演韓寒:甘孜太美,被深深震撼

      封面新聞
      2026-02-20 22:25:23
      癌的“源頭”已發現?咸菜沒上榜,第一名大家或許天天都在吃!

      癌的“源頭”已發現?咸菜沒上榜,第一名大家或許天天都在吃!

      健康之光
      2026-02-11 14:15:20
      球迷熱議中國男籃14人出征名單 官方評論區被沖爆高詩巖頻繁被點名

      球迷熱議中國男籃14人出征名單 官方評論區被沖爆高詩巖頻繁被點名

      狼叔評論
      2026-02-23 12:06:09
      16GB+1TB!新機官宣:2月25日,正式首發!

      16GB+1TB!新機官宣:2月25日,正式首發!

      科技堡壘
      2026-02-23 12:20:47
      救救美國的中產吧,他們都快要餓死了!

      救救美國的中產吧,他們都快要餓死了!

      走讀新生
      2026-01-27 21:49:52
      球員錦標賽:趙心童10:7奪冠,肖國棟直播聊八卦,已欠我兩頓飯

      球員錦標賽:趙心童10:7奪冠,肖國棟直播聊八卦,已欠我兩頓飯

      林子說事
      2026-02-23 07:43:47
      王思聰是一個怎樣的人?網友說他回答網友時并不是那樣嬉笑怒罵

      王思聰是一個怎樣的人?網友說他回答網友時并不是那樣嬉笑怒罵

      侃神評故事
      2026-02-22 19:10:03
      精神小妹的生活原來是這樣的!網友:終于知道她們為啥都這么瘦了

      精神小妹的生活原來是這樣的!網友:終于知道她們為啥都這么瘦了

      深度報
      2026-02-11 23:35:03
      冷空氣馬上到!廣州有中到大雨

      冷空氣馬上到!廣州有中到大雨

      番禺臺
      2026-02-23 12:37:06
      羅體:橫條紋球衣是丑陋的,這支尤文連平庸的表現都難以維持

      羅體:橫條紋球衣是丑陋的,這支尤文連平庸的表現都難以維持

      懂球帝
      2026-02-22 20:09:06
      吳石夫人王碧奎晚年自述,寧在臺流浪不返大陸,居美國訴心底真意

      吳石夫人王碧奎晚年自述,寧在臺流浪不返大陸,居美國訴心底真意

      嘮叨說歷史
      2026-02-02 18:45:08
      并非迷信!今天大年初七,牢記:1要洗、2不做、3要吃、別犯忌諱

      并非迷信!今天大年初七,牢記:1要洗、2不做、3要吃、別犯忌諱

      阿龍美食記
      2026-02-23 00:50:03
      郭碧婷爸爸曬三個女兒帶女婿們回家,感嘆就缺大女婿向佐一個

      郭碧婷爸爸曬三個女兒帶女婿們回家,感嘆就缺大女婿向佐一個

      趕集的山姑娘
      2026-02-23 10:48:54
      2026-02-23 13:12:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      12192文章數 176389關注度
      往期回顧 全部

      科技要聞

      騰訊字節,“火拼”漫劇

      頭條要聞

      中美戰機在黃海上空對峙 韓國不滿向美國提出抗議

      頭條要聞

      中美戰機在黃海上空對峙 韓國不滿向美國提出抗議

      體育要聞

      哈登版騎士首?。豪做墓谲娬n

      娛樂要聞

      谷愛凌奶奶去世,谷愛凌淚奔

      財經要聞

      結婚五金邁入10萬大關 年輕人結婚更難了

      汽車要聞

      續航1810km!smart精靈#6 EHD超級電混2026年上市

      態度原創

      教育
      家居
      數碼
      健康
      軍事航空

      教育要聞

      大動作:英國留學劇本大變!

      家居要聞

      本真棲居 愛暖伴流年

      數碼要聞

      英國硬盤價格高得讓人飛到美國購買:跨越半個地球竟省一大筆錢

      轉頭就暈的耳石癥,能開車上班嗎?

      軍事要聞

      美軍重兵集結蓄力作戰之際 新一輪美伊談判時間“敲定”

      無障礙瀏覽 進入關懷版