<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      李飛飛的答案:大模型之后,Agent 向何處去?

      0
      分享至



      劃重點:

      1、李飛飛最新論文,為當下火熱的Agent劃定了邊界、確立了范式。谷歌、OpenAI和微軟等巨頭的最新布局,幾乎都遵循了論文給出的能力棧。

      2、論文提出了一套完整的認知閉環(huán)架構——從感知、認知、行動,到學習與記憶,構成動態(tài)迭代的智能體體系。這不僅是技術的整合,更是對未來AGI路徑的系統(tǒng)性構想。

      3、大模型是驅(qū)動Agent的核心引擎,但環(huán)境交互是解決幻覺和偏見的關鍵錨點。論文強調(diào),LLM/VLM提供認知能力,但必須通過真實或模擬環(huán)境的反饋來校準現(xiàn)實,減少幻覺,并引入倫理與安全機制。

      4、應用潛力橫跨游戲、機器人和醫(yī)療三大前沿領域——游戲中的沉浸式NPC、機器人中的自主規(guī)劃與物理操作、醫(yī)療中的智能問診與健康管理,展現(xiàn)了Agent從理論走向?qū)嵺`的清晰路徑。

      作者 林易

      編輯重點君

      2025年,被普遍認為是Agent的元年,與之相關的概念從年初至今熱度持續(xù)走高,包括智能體、AI Agent、Agentic AI等等。

      而就在最近,一篇由李飛飛領銜的Agent重磅論文在業(yè)內(nèi)引發(fā)了廣泛討論,熱度居高不下。網(wǎng)友們?nèi)绱嗽u價:“幾乎是跪著看完的”、“太清晰,硬控了我3個小時”。

      這篇長達80頁的綜述名為《Agent AI: Surveying the Horizons of Multimodal Interaction》,由李飛飛等14位來自斯坦福大學和微軟的專家聯(lián)合撰寫。



      它之所以備受推崇,是因為這篇綜述為Agent這一略顯混沌的領域,建立了一個清晰的框架:從感知-決策-行動,到記憶、工具使用、環(huán)境交互與評測,試圖把分散在對話模型、視覺-語言模型、強化學習、工具調(diào)用等技術線索,統(tǒng)一到一個多模態(tài)Agent的新視角里。

      并且,雖然這篇論文最早發(fā)表于去年年底,但站在當下節(jié)點回顧今年Agent的發(fā)展,谷歌、OpenAI和微軟等主流玩家的核心打法,幾乎都是按照論文給出的能力棧來推進的;這也反過來印證了論文對“從大模型到Agent”這一演進路徑的前瞻性判斷。

      也正如李飛飛在自傳《我看見的世界》里強調(diào)的,“現(xiàn)在學生太過于追求熱點,其實很多老論文是非常經(jīng)典且具備借鑒意義”;即便這篇綜述發(fā)表至今不過半年,但其意義之大、影響之深,仍值得每一位AI從業(yè)者深入品讀。

      接下來,我們就一起看看這篇綱領性巨作的核心價值。

      01

      Agent AI的核心:一個全新的智能體認知架構

      要理解這篇論文的精髓,首先必須把握其提出的全新Agent AI范式。這遠非對現(xiàn)有技術棧的簡單拼湊,更是一種對未來通用人工智能(AGI)發(fā)展路徑的前瞻性思考。

      論文中的架構圖,便清晰地定義了這個范式的五個核心模塊,它們共同構成了一個完整的、可交互的智能體認知閉環(huán)。



      首先是環(huán)境與感知(Environment and Perception),這是智能體與世界交互的起點。

      與傳統(tǒng)模型被動接收結構化數(shù)據(jù)不同,Agent AI主動從物理或虛擬世界中感知信息;這種感知是多模態(tài)的,涵蓋視覺、聽覺、文本、傳感器數(shù)據(jù)等。

      更重要的一點是,感知模塊內(nèi)嵌了任務規(guī)劃與技能觀察(Task-Planning and Skill Observation)的能力;這意味著Agent在感知環(huán)境時,并非茫然地接收一切信息,而是帶著明確的目的去理解。

      第二個核心模塊是認知(Cognition)

      如果說感知是輸入,那么認知就是處理中樞,是Agent的“大腦”。論文將認知定義為一個極其復雜的系統(tǒng),包含思考、意識、感知、共情等高級智能活動。

      這正是大語言模型(LLM)和視覺語言模型(VLM)發(fā)揮核心作用的場域。它們?yōu)锳gent提供了強大的世界知識、邏輯推理和上下文理解能力。認知模塊負責解釋感知到的信息,進行多步推理,并制定出實現(xiàn)目標的策略。

      接下來是行動(Action),它承接認知模塊的決策,負責生成具體的操作指令。

      這些指令可以是與物理世界交互的機器人控制命令(如移動、抓取),也可以是與虛擬世界交互的API調(diào)用、代碼生成或自然語言回復。行動模塊通過控制器(Controller)作用于環(huán)境,從而改變環(huán)境的狀態(tài)。

      第四個核心模塊是學習(Learning)

      Agent AI并非一個靜態(tài)系統(tǒng),其核心優(yōu)勢在于持續(xù)學習和自我進化的能力。論文強調(diào)了多種學習機制,包括預訓練(Pretraining)、零樣本/少樣本學習(Zero-shot/Few-shot)、強化學習(RL)和模仿學習(IL)。

      通過與環(huán)境的交互(即“Agent Interactive Closed-loop”),Agent從成功和失敗的經(jīng)驗中學習。環(huán)境的反饋(Feedback)會回流至學習和記憶模塊,用于優(yōu)化未來的決策。

      最后,便是記憶(Memory)。

      傳統(tǒng)模型的“記憶”通常局限于短暫的上下文窗口,而Agent AI的記憶模塊則是一個更持久、更結構化的系統(tǒng)。它存儲著知識(Knowledge)、邏輯(Logic)、推理路徑(Reasoning)和推斷(Inference)的結果。

      這使得Agent能夠從過去的經(jīng)驗中提取知識,形成長期記憶,從而在面對新任務時,不必從零開始,而是可以舉一反三。

      這五個模塊共同構成了一個動態(tài)的、持續(xù)迭代的閉環(huán)。Agent通過感知環(huán)境,在認知核心的驅(qū)動下做出決策,通過行動改變環(huán)境,再從環(huán)境的反饋中學習和更新記憶,從而在每一次交互中,都比上一次更智能、更高效。

      02

      大模型如何驅(qū)動Agent AI?

      我們剛才解讀的Agent AI新范式,可以說是這篇綜述藍圖中的一個維度。

      Agent AI的宏大框架之所以在今天成為可能,其根本驅(qū)動力,源于大型基礎模型(Foundation Models),特別是LLM和VLM的成熟。它們是Agent認知能力的基石,但也帶來了新的挑戰(zhàn)。



      LLMs(如GPT系列)和VLMs(如CLIP、LLaVA)通過在海量數(shù)據(jù)上的預訓練,內(nèi)化了關于世界的大量常識知識和專業(yè)知識。這使得Agent在啟動之初就具備了強大的零樣本規(guī)劃能力。

      例如,當一個機器人Agent接收到“幫我熱一下午餐”的指令時,它能利用LLM的知識,自動將這個模糊指令分解為一系列具體的子任務:“打開冰箱->找到午餐盒->把它放到微波爐里->設置時間->啟動微波爐”。

      這種能力極大地降低了為每個任務編寫復雜規(guī)則的成本。

      除此之外,論文敏銳地指出了大模型的一個核心問題——「幻覺」,即模型可能生成與事實不符或毫無根據(jù)的內(nèi)容。

      這在需要與物理世界精確交互的場景中是致命的。例如,一個機器人Agent如果“幻覺”出一個不存在的物體并試圖抓取,可能會導致任務失敗甚至設備損壞。

      Agent AI范式通過“環(huán)境交互”為解決幻覺問題提供了一個關鍵的「錨點」。因為Agent的決策和行動必須在真實或模擬的環(huán)境中得到驗證。

      如果模型生成的計劃在環(huán)境中不可執(zhí)行(例如,試圖穿過一堵墻),環(huán)境會立即提供負反饋。這種持續(xù)的、基于物理規(guī)律的反饋,會倒逼模型將其內(nèi)部的知識與外部的現(xiàn)實世界對齊,從而顯著減少幻覺的發(fā)生。

      基礎模型同樣會繼承訓練數(shù)據(jù)中的社會偏見。一個在充滿偏見文本上訓練的Agent,其行為和語言也可能帶有歧視性。

      論文強調(diào),在設計Agent AI時,必須將包容性作為一項核心原則。這包括使用更多元化的數(shù)據(jù)進行訓練、建立偏見檢測與糾正機制,以及在人機交互中設計符合道德和尊重他人的指導方針。

      當Agent(尤其是在醫(yī)療、家居等敏感領域)與用戶進行深度交互時,會收集大量個人數(shù)據(jù)。如何確保這些數(shù)據(jù)的隱私和安全,是一項重大的倫理和技術挑戰(zhàn)。

      論文提出,需要為Agent AI建立明確的法規(guī)和監(jiān)管框架,確保數(shù)據(jù)使用的透明度,并給予用戶控制其數(shù)據(jù)的權利。例如,通過提示工程(Prompt Engineering)限制模型的行為范圍,或者增加一個由人類監(jiān)督的驗證層,都是確保Agent在安全可控范圍內(nèi)運行的有效手段。

      03

      Agent AI的應用潛力

      論文不僅提出了理論框架,還深入探討了Agent AI在三個前沿領域的巨大應用潛力,展示了其如何從理論走向現(xiàn)實。

      首先就是游戲(Gaming)場景。

      傳統(tǒng)的游戲NPC(非玩家角色)行為由固定的腳本驅(qū)動,模式單一、可預測,而Agent AI將徹底改變這一現(xiàn)狀。

      例如,基于LLM的Agent可以扮演NPC,擁有自己的記憶、目標和情感。它們能與玩家進行真正有意義的對話,根據(jù)玩家的行為和游戲世界的變化動態(tài)調(diào)整自己的行為,甚至形成復雜的社會關系。斯坦福的“生成式智能體”小鎮(zhèn)實驗(Generative Agents)正是這一理念的早期探索。

      并且,玩家可以用自然語言與游戲世界互動,比如告訴NPC“我們?nèi)ド掷飳ふ也菟帯保琋PC能夠理解并協(xié)同行動。這為開放世界游戲帶來了前所未有的沉浸感和自由度。

      Agent還可以作為創(chuàng)作者的“AI副駕駛”,根據(jù)簡單的指令或草圖,自動生成游戲關卡、道具甚至完整的3D場景,極大地提高游戲開發(fā)效率。



      其次是機器人(Robotics)場景。

      機器人可以說是Agent AI最直接的物理化身(Embodiment),用戶只需用日常語言下達指令(如“把桌子收拾干凈”),機器人Agent就能自主規(guī)劃并執(zhí)行一系列復雜的物理操作。

      論文展示了使用GPT-4V來理解人類視頻演示,并將其轉化為機器人可執(zhí)行任務序列的實驗,這讓機器人編程變得如「教孩子做事」般直觀。

      在模擬環(huán)境中訓練機器人成本低、效率高,但如何將學到的技能遷移到物理世界是一個核心挑戰(zhàn)。Agent AI通過領域隨機化(Domain Randomization)等技術,在模擬訓練中引入足夠多的變化(如光照、材質(zhì)、物理參數(shù)的變化),使學到的策略對真實世界的細微差異更具魯棒性。

      機器人Agent融合視覺、語言、觸覺等多種信息來理解環(huán)境。例如,它不僅“看到”一個杯子,還能通過語言指令理解這個杯子是“易碎的”,從而在抓取時采用更輕柔的力度。



      最后,在醫(yī)療健康(Healthcare)中,Agent AI同樣具備巨大的應用潛力。

      Agent可以作為醫(yī)療聊天機器人,初步問診、收集病史,并基于醫(yī)學知識庫為醫(yī)生提供診斷建議,特別是在醫(yī)療資源匱乏的地區(qū),能極大地提升初級診療的覆蓋率和效率。

      醫(yī)療領域的知識更新極快,任何錯誤都可能危及生命。Agent AI可以連接權威的、實時更新的醫(yī)學數(shù)據(jù)庫,在生成診斷建議時,同步進行事實核查和來源引用,這對于抑制模型幻覺、保證信息的準確性至關重要。



      Agent可以幫助處理和分流大量的患者信息,監(jiān)控慢性病患者的生命體征數(shù)據(jù),并及時向醫(yī)生發(fā)出預警,實現(xiàn)更高效的個性化健康管理。

      結語

      盡管前景廣闊,但這篇綜述也清醒地認識到,Agent AI仍處于早期階段,面臨著跨越模態(tài)、領域和現(xiàn)實的多重鴻溝。

      例如,如何讓Agent真正實現(xiàn)視覺、語言、聽覺、動作等模態(tài)的深度融合,而不只是淺層拼接,是未來的核心研究方向。

      以及如何訓練一個能在游戲、機器人和醫(yī)療等截然不同領域都能高效工作的“通用Agent”,而不是為每個領域定制一個模型,是通往AGI的關鍵一步。

      并且在評測與基準方面,如何科學地評測一個Agent的智能水平也是關鍵。為此,論文團隊提出了新的評測基準,如用于多智能體協(xié)作的“CuisineWorld”和用于視頻理解的“VideoAnalytica”。建立標準化的評測體系,對于指引領域發(fā)展、衡量技術進步至關重要。

      回歸原文來看,李飛飛等人的這篇《Agent AI》綜述,遠不止是對現(xiàn)有研究的簡單梳理。它提出了一個統(tǒng)一、完整的Agent AI認知框架,闡述了大型基礎模型在其中扮演的核心角色,并且系統(tǒng)性地剖析了其在關鍵應用領域的機遇與挑戰(zhàn)。為當前略顯喧囂和碎片化的Agent研究領域,提供了一張不可或缺的“地圖”。

      最后,大家可以一鍵傳送論文原文:

      https://arxiv.org/abs/2401.03568

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      2026年1月起,“四大降價潮”或全面來襲,這次不只是房子

      2026年1月起,“四大降價潮”或全面來襲,這次不只是房子

      平說財經(jīng)
      2026-01-14 22:45:17
      繃不住!今年的就業(yè)環(huán)境能有多差?網(wǎng)友:研究生月薪四千都找不到

      繃不住!今年的就業(yè)環(huán)境能有多差?網(wǎng)友:研究生月薪四千都找不到

      滑稽斑馬呀
      2026-01-15 21:27:08
      這就是亂站隊的代價!孫濤無論如何也想不到他前腳力挺閆學晶

      這就是亂站隊的代價!孫濤無論如何也想不到他前腳力挺閆學晶

      忠于法紀
      2026-01-15 22:10:01
      聶衛(wèi)平前妻孔祥明:二婚住四川老家,兒子跟她姓,在日本結婚生子

      聶衛(wèi)平前妻孔祥明:二婚住四川老家,兒子跟她姓,在日本結婚生子

      攬星河的筆記
      2026-01-15 16:16:10
      醫(yī)學的盡頭真是玄學嗎?網(wǎng)友:國家不讓你迷信,沒說讓你不信

      醫(yī)學的盡頭真是玄學嗎?網(wǎng)友:國家不讓你迷信,沒說讓你不信

      帶你感受人間冷暖
      2025-12-31 00:20:05
      教了那么多年書,我發(fā)現(xiàn):數(shù)學很差的孩子,一般物理也不會好

      教了那么多年書,我發(fā)現(xiàn):數(shù)學很差的孩子,一般物理也不會好

      好爸育兒
      2026-01-15 16:13:42
      原來大佬寫的推薦信都這么短啊 ??!網(wǎng)友:有用不在于字多

      原來大佬寫的推薦信都這么短啊 ??!網(wǎng)友:有用不在于字多

      夜深愛雜談
      2026-01-10 22:24:02
      “生死都在臺灣?”郭臺銘:若兩岸開戰(zhàn),將提供物資用以對抗大陸

      “生死都在臺灣?”郭臺銘:若兩岸開戰(zhàn),將提供物資用以對抗大陸

      boss外傳
      2025-07-30 11:00:03
      沙特聯(lián)最新積分戰(zhàn)報 利雅得新月一枝獨秀 利雅得勝利3隊同分

      沙特聯(lián)最新積分戰(zhàn)報 利雅得新月一枝獨秀 利雅得勝利3隊同分

      狂言體育
      2026-01-15 15:22:00
      “這種兒子,直接用鋼筋揍!”家長曬農(nóng)村兒子現(xiàn)狀,網(wǎng)友忍無可忍

      “這種兒子,直接用鋼筋揍!”家長曬農(nóng)村兒子現(xiàn)狀,網(wǎng)友忍無可忍

      妍妍教育日記
      2026-01-08 20:37:01
      央行副行長鄒瀾:近期中國物價水平已出現(xiàn)積極變化

      央行副行長鄒瀾:近期中國物價水平已出現(xiàn)積極變化

      新京報
      2026-01-15 17:15:06
      金與正的婚姻決定震驚朝鮮內(nèi)外:再也不會有第二個張成澤!

      金與正的婚姻決定震驚朝鮮內(nèi)外:再也不會有第二個張成澤!

      阿校談史
      2025-07-23 16:33:19
      固態(tài)電池最新8大核心龍頭企業(yè),這篇文章幫你梳理清楚

      固態(tài)電池最新8大核心龍頭企業(yè),這篇文章幫你梳理清楚

      新浪財經(jīng)
      2026-01-15 12:09:39
      1954年,甘祖昌得知被評為準軍級:我有意見,要向中央討要個說法

      1954年,甘祖昌得知被評為準軍級:我有意見,要向中央討要個說法

      搜史君
      2026-01-16 06:35:04
      臨陣止戈!特朗普最后時刻叫停對伊軍事打擊,戰(zhàn)機緊急返航

      臨陣止戈!特朗普最后時刻叫停對伊軍事打擊,戰(zhàn)機緊急返航

      老馬拉車莫少裝
      2026-01-15 21:45:22
      攤牌了,阿韋洛亞爆爭議發(fā)言!皇馬高層很意外,球迷:別辭職了吧

      攤牌了,阿韋洛亞爆爭議發(fā)言!皇馬高層很意外,球迷:別辭職了吧

      阿泰希特
      2026-01-15 11:32:22
      國王杯八強出爐:巴薩馬競畢包在列,阿爾瓦塞特淘汰皇馬晉級

      國王杯八強出爐:巴薩馬競畢包在列,阿爾瓦塞特淘汰皇馬晉級

      懂球帝
      2026-01-16 06:29:30
      回國了我才敢說:委內(nèi)瑞拉,是我去過的所有國家中,最被看輕的!

      回國了我才敢說:委內(nèi)瑞拉,是我去過的所有國家中,最被看輕的!

      阿纂看事
      2026-01-09 09:48:35
      車在橋上,人在哪里?38歲男子元旦失聯(lián):留下一句“人生沒意義”

      車在橋上,人在哪里?38歲男子元旦失聯(lián):留下一句“人生沒意義”

      奇思妙想草葉君
      2026-01-05 20:57:05
      四川涼山15歲少年半年前疑被騙至柬埔寨,失聯(lián)前曾發(fā)求救視頻,母親:他為了攢錢給自己治眼睛,當?shù)鼐揭呀槿?>
    </a>
        <h3>
      <a href=揚子晚報
      2026-01-15 21:27:04
      2026-01-16 07:19:00
      劃重點KeyPoints incentive-icons
      劃重點KeyPoints
      追蹤全球AI科技,記錄中國硬核崛起
      145文章數(shù) 15關注度
      往期回顧 全部

      科技要聞

      阿里最狠的一次“自我革命”

      頭條要聞

      白宮:特朗普正密切關注伊朗局勢 并保留所有選項

      頭條要聞

      白宮:特朗普正密切關注伊朗局勢 并保留所有選項

      體育要聞

      聶衛(wèi)平:黑白棋盤上的凡人棋圣

      娛樂要聞

      92歲陶玉玲去世,馮遠征曹可凡悼念

      財經(jīng)要聞

      央行再次結構性降息0.25個百分點

      汽車要聞

      吉利帝豪/繽越推冠軍一口價 起售價4.88萬

      態(tài)度原創(chuàng)

      數(shù)碼
      本地
      旅游
      健康
      公開課

      數(shù)碼要聞

      部分內(nèi)存條價格暴漲超300% 報告稱存儲市場進入超級牛市

      本地新聞

      云游內(nèi)蒙|黃沙與碧波撞色,烏海天生會“混搭”

      旅游要聞

      信念同向,沙漠亦可開花(旅人心語)

      血常規(guī)3項異常,是身體警報!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 人妻三级成| 亚洲无码日日| 国产欧美另类精品久久久 | 中文字幕久久久久人妻| 国产一区国产二区高清无码| 亚洲精品久久久久国产| 91乱伦视频| 成人av亚洲精品| 婷婷激情综合| 国产精品视频一区二区三区无码 | 亚洲自偷自偷在线成人网站传媒| 亚洲精品一区二区三区四区五区| 26uuu另类亚洲欧美日本| 郸城县| 波多野结衣av一区二区三区中文| 无套内谢少妇毛片aaaa片免费| 最近中文字幕mv在线资源| 激情国产一区二区三区四区小说| 国产欧美VA天堂在线观看视频| 亚洲www啪成人一区二区| 定襄县| 国产精品自在线拍国产手青青机版 | 日韩丰满少妇无码内射| 靖西县| 免费ā片在线观看| 国产精成人| 95在线一区| 亚洲天堂无码| 欧美精品卡一卡二| 国产亚洲精品自在久久vr| 国产精品亚洲欧美一区麻豆| 久久av无码精品人妻糸列| 亚洲欧美日韩高清一区二区三区| 波多野结av衣东京热无码专区| 午夜社区| 亚洲三区在线观看内射后入| 精品自拍网| 内射极品人妻| 精品国产乱子伦一区二区三区,精品一| www.狠狠干| 成人午夜视频一区二区无码|