當前正是Agent發展的黃金時期,對于想要在該領域發論文的同學來說,掌握其高效的學習路徑、深入了解Agent的核心系統形態/技術融合創新至關重要。
本文根據以上三維視角,整理了131篇前沿論文,包含當前頂會熱點“多智能體”、“大模型智能體”等,以及“入門→進階→研究→應用”全流程必讀經典論文。
另外,為方便大家理解,谷歌發布的321個Agent落地案例我也連同代碼一起打包了,相信這份“大禮包”可以幫助各位快速入門,順利開始論文寫作。
![]()
掃碼添加小享,回復“agent合集”
免費獲取全部論文+代碼+項目
Agent 核心系統形態
這類是 Agent 入門時首先要理解的核心概念,直接決定系統的協作模式與應用場景。
單智能體
獨立完成任務的單一智能體系統,聚焦 “個體決策、自主執行”,比如個人助理、單機器人控制。
ATA: Adaptive Transformation Agent for Text-Guided Subject-Position Variable Background Inpainting
方法:論文提出自適應變換單智能體(A?A),以Hunyuan-DiT為基礎,通過含反向排列PosAgent塊的RDT模塊預測位移、調整主體位置,加位置切換嵌入支持“自適應/固定”模式,經混合訓練后,在文本引導的背景補全任務(可變/固定主體位置)中表現優異。
![]()
創新點:
提出“文本引導主體位置可變背景補全”新任務,可自適應調整主體位置以匹配背景。
設計含反向位移變換(RDT)模塊的A?A單智能體,借反向排列的PosAgent塊優化主體位置、緩解變形。
為A?A加位置切換嵌入,支持“自適應/固定”位置切換,搭配混合訓練適配兩種補全場景。
由多個智能體組成的協同系統,聚焦 “群體協作、沖突解決”,如自動駕駛車隊、醫療多模態診斷團隊。
V-Stylist: Video Stylization via Collaboration and Reflection of MLLM Agents
方法:論文提出V-Stylist多智能體系統做文本引導視頻風格化:Video Parser拆視頻、生提示,Style Parser搜匹配風格模型,Style Artist多輪反思調細節;三智能體協同解決核心痛點,還建TVSBench基準,性能超現有方法。
![]()
創新點:
提出V-Stylist多智能體系統,用Video Parser、Style Parser、Style Artist分別解決視頻過渡、風格匹配、細節控制問題。
給各智能體配特色機制:Video Parser拆視頻生提示,Style Parser樹狀搜索匹配風格,Style Artist多輪反思調參數。
構建TVSBench評測基準,含50個視頻和17種風格,填補復雜視頻風格化的評估空白。
掃碼添加小享,回復“agent合集”
免費獲取全部論文+代碼+項目
Agent 技術基礎與融合創新
這類是實現 Agent 的 “技術底座” 與 “創新方向”,覆蓋從 “怎么建、怎么用、怎么評” 到 “技術交叉創新” 的全流程,是論文選題的核心方向。
大模型智能體
以大模型為核心的 Agent 技術體系,包含 “構建、應用、評估” 全鏈路,是當前主流技術基礎。
SWEET-RL:Training Multi-Turn LLM Agents on Collaborative Reasoning Tasks
方法:論文為提升大模型智能體多輪協作能力,建了ColBench基準(含編程、設計場景),提了SWEET-RL算法——讓智能體借訓練時額外信息練優勢函數、再優化策略,解決傳統RL問題,使Llama-3.1-8B性能升6%,比肩GPT-4o。
![]()
創新點:
建ColBench基準,覆蓋編程、設計真實協作場景,用LLM模擬交互并低成本評估,補全現有基準空白。
提SWEET-RL算法,讓大模型智能體借訓練時參考信息,練回合級優勢函數,解決傳統價值函數泛化差問題。
設計兩階段訓練流程,用優勢函數當獎勵模型、DPO優化策略,提升大模型智能體性能,比肩GPT-4o。
將 “圖技術” 與 Agent 融合的創新范式,聚焦 “提升推理效率、優化記憶管理、增強多體協同”。
AFLOW: AUTOMATING AGENTIC WORKFLOW GENERATION
方法:論文提 AFLOW 框架,幫大模型智能體自動生成工作流:把工作流做成代碼化搜索空間,用蒙特卡洛樹搜索 + 預定義算子探索,大模型負責修改擴展工作流,結合執行反饋優化。它在 6 個數據集上超現有方法 5.7%,還能讓小模型以 GPT-4o 4.55% 成本在特定任務上趕超。
![]()
創新點:
把大模型智能體工作流優化變成代碼化搜索問題,用節點和邏輯邊建模,不用人工設計。
提出 AFLOW 框架,靠蒙特卡洛樹搜索+預定義算子,結合大模型擴展、反饋優化工作流。
讓小模型以GPT-4o 4.55%成本在特定任務趕超它,且在 6 個基準數據集上平均優于現有方法 5.7%,平衡性能與成本。
掃碼添加小享,回復“agent合集”
免費獲取全部論文+代碼+項目
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.