<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      從“造工具”到“用倉庫”:RepoMaster,駕馭GitHub解決復雜任務的智能體大師!

      0
      分享至


      RepoMaster旨在讓AI智能體像人類專家一樣,解決真實世界中的復雜開發任務。

      作者丨QuantaAlpha

      GitHub 上托管著超過5.2億個代碼倉庫,形成了一個龐大且持續增長的開源生態系統。然而,對于開發者而言,這片富饒的“代碼海洋”也常常意味著巨大的挑戰:我們都曾有過這樣的經歷——在GitHub上找到一個看似完美的項目,滿懷希望地 git clone,卻旋即陷入環境配置、依賴沖突和代碼理解的泥潭。過時的文檔、復雜的內部邏輯和隱藏的入口點,常常讓“復用”的初衷演變成一場耗時費力的“考古”。

      與主流社區致力于“為AI智能體開發更多專用工具”的思路不同,我們認為,真正能被轉化的工具并不匱乏,解決智能體落地應用的挑戰并非需要耗費大量人力、時間來專門設計和制造工具,而是如何讓智能體學會駕馭這個已經存在的、海量的代碼世界。

      因此,中科院、清華大學、北京大學、新加坡國立大學等機構的研究者,與前沿開源學術組織 QuantaAlpha 及階躍星辰姜大昕團隊聯合,共同推出了RepoMaster,其核心理念并非“造輪子”,而是“找到并用好輪子”——它能夠根據任務需求,首先利用深度搜索技術在海量開源項目中定位并篩選出最相關的代碼倉庫,然后將這個倉庫視為一個潛在的、可以直接調用的強大工具。RepoMaster 旨在讓AI智能體像人類專家一樣,能夠自主探索和理解陌生的代碼庫,從中快速提煉核心功能并加以利用;然后,它基于這份理解,自主地規劃任務、編寫和執行代碼,并根據環境反饋進行動態調整,從而以最小的適配成本,解決真實世界中的復雜開發任務。


      • 論文標題:RepoMaster: Autonomous Exploration and Understanding of GitHub Repositories for Complex Task Solving

      • 論文鏈接:https://arxiv.org/pdf/2505.21577

      • GitHub: https://github.com/QuantaAlpha/RepoMaster

      01

      RepoMaster核心框架:從深度理解到自主執行的三步閉環

      RepoMaster的工作流程始于動態搜索與選擇:它首先根據任務需求,利用深度搜索技術在GitHub上篩選并鎖定最合適的代碼倉庫。在此之后,RepoMaster的核心優勢便體現于其三階段閉環框架,該框架系統性地解決了AI智能體在面對陌生代碼庫時“看不懂、用不來”的根本難題,從而實現高效、自主的任務執行。


      第一階段:層級化倉庫分析—— 從全局到核心

      面對陌生的代碼庫,RepoMaster首先進行靜態的、結構感知的分析,為后續探索建立一幅“導航地圖”。

      • 混合結構化倉庫映射:通過AST解析,RepoMaster構建出三種互補視圖來描繪代碼庫全貌:

        ?層次化代碼樹 (HCT):揭示代碼的包、模塊、類、函數間的層級關系。

        ?函數調用圖 (FCG):描繪函數間的調用關系,追蹤程序脈絡。

        ?模塊依賴圖 (MDG):理清模塊間的導入依賴,洞察項目架構。

      • 核心組件識別:RepoMaster獨創了一套多維度評分機制(綜合依賴度、復雜度、Git更新頻率等),從全局視圖中精準定位出倉庫最關鍵的核心模塊與類,為后續探索提供焦點。


      第二階段:自主探索與執行 (Autonomous Exploration & Execution) —— 從靜態地圖到動態導航

      有了結構化的“地圖”和初始上下文,RepoMaster便開始了任務驅動的動態探索與執行循環。

      • 上下文感知的代碼探索 (Context-aware Code Exploration):RepoMaster配備了一套強大的探索工具集,允許智能體:

        ?精細化代碼查看:按需查看任意文件、類或函數的具體實現。

        ?依賴分析:沿著函數調用圖(FCG)和模塊依賴圖(MDG)追溯調用鏈和依賴路徑。

        ?代碼搜索:通過關鍵詞快速定位相關代碼片段。

      • 基于反饋的交互式執行 (Interactive Feedback-based Execution):探索與執行并非線性序列,而是一個緊密交織的閉環。智能體可以靈活地在編寫代碼、查看文件、分析日志和追蹤依賴之間切換,并根據執行結果(成功或失敗)的反饋,實時調整下一步的行動策略,實現“邊做邊學、邊學邊做”。

      第三階段:高效信息篩選—— 為LLM上下文“減負”

      為在有限的token窗口內進行高效的多輪交互,RepoMaster采用了一套多層次信息篩選策略,確保每一輪交互都聚焦于高價值信息:

      • 代碼減負:對源代碼,僅提取與任務相關的AST子樹。

      • 文檔減負:對大型文檔,將其分塊并根據任務相關性檢索最關鍵的片段。

      • 日志減負:對執行日志,模仿人類調試習慣,只保留包含關鍵錯誤信息的首尾部分,過濾掉冗長的中間輸出。

      02

      實驗評估:效果與效率的雙重飛躍

      為了驗證RepoMaster的實力,我們選用了兩大極具挑戰性的評測基準,二者均摒棄了傳統的“從零生成代碼”模式,轉而考察智能體直接在現有代碼庫上解決復雜任務的能力。第一個是MLE-R,它改編自 OpenAI 的 MLE-Bench,將評測范式從“從零寫代碼”轉變為“復用GitHub項目解決機器學習任務”。第二個是我們全新構建的GitTaskBench,它將這一理念擴展到更廣泛的真實世界任務(如老照片修復、語音降噪等),并開創性地引入了交付質量(Task Pass Rate)作為核心指標,旨在評測AI智能體端到端“交付成果”而非僅僅“跑通代碼”的能力。



      • 性能全面超越:無論是在MLE-R還是GitTaskBench上,RepoMaster的表現都遠超OpenHands和SWE-Agent等主流框架。以GitTaskBench為例,在Claude 3.5模型的驅動下,RepoMaster將最高任務成功率從40.74%提升至62.96%,實現了跨越式增長。

      • 效率大幅領先:更令人印象深刻的是,RepoMaster在取得優異性能的同時,展現了極高的效率。在GitTaskBench上,RepoMaster的token消耗量僅為SWE-Agent的約57%,極大地降低了使用成本。

      • 消融實驗驗證核心組件有效性:通過逐一移除核心組件,實驗證明了層級化分析、代碼探索和信息篩選三大模塊對于性能的決定性作用。移除任何一個組件都會導致性能顯著下降,驗證了RepoMaster設計的科學性與完整性。


      03

      案例分析:直觀對比

      在一個復雜的3D姿態估計任務中,基線智能體或因無效的試錯而失敗,或因缺乏對倉庫的整體理解而偏離核心算法。相比之下,RepoMaster憑借其結構化分析能力,迅速鎖定了關鍵組件,高效地完成了任務,直觀地展示了其在解決真實世界復雜問題上的優勢。


      04

      結論與展望

      RepoMaster的提出,不僅是性能指標上的突破,更重要的是,它為AI智能體如何有效利用龐大的人類代碼遺產庫指明了一條清晰可行的道路。它證明了將開源倉庫被有效利用后能被視為可組合、可復用的“工具”,而非從零開始的“負擔”,是解決復雜現實世界任務的強大范式。

      未來,RepoMaster的設計理念有望推動一個更具可持續性和協作性的AI-for-code生態系統,為實現多項目的大規模協同、軟件缺陷的自動化修復,乃至向硬件描述語言、機器人中間件等領域的遷移奠定基礎。通過讓AI智能體真正學會“站在巨人的肩膀上”,RepoMaster正在加速人機協作的良性循環,推動整個開源世界的持續創新與進步。


      關于 QuantaAlpha
      ?QuantaAlpha 成立于 2025 年 4 月,由來自清華、北大、中科院、CMU、港科大、中科大等學校的教授、博士后、博士與碩士組成。我們的使命是探索智能的“量子”世界,引領智能體研究的“阿爾法”前沿 —— 從CodeAgent到自進化智能,再到金融、醫療等跨領域專用智能體,致力于重塑人工智能的邊界。

      ? 2025 年,我們將在CodeAgent(真實世界任務的端到端自主執行)、DeepResearch、Agentic Reasoning/Agentic RL、自進化與協同學習等方向持續產出高質量研究成果,歡迎對我們方向感興趣的同學加入我們!

      團隊主頁:https://quantaalpha.github.io/

      未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社區進行轉載!

      公眾號轉載請先在「AI科技評論」后臺留言取得授權,轉載時需標注來源并插入本公眾號名片。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      蘇聯不要的裝備,70萬武器被八路軍拉3天3夜,撿出“半個軍械庫”

      蘇聯不要的裝備,70萬武器被八路軍拉3天3夜,撿出“半個軍械庫”

      古書記史
      2025-12-15 23:29:05
      WOC!恭喜李月汝!

      WOC!恭喜李月汝!

      刺猬籃球
      2025-12-18 22:34:40
      當年赴華的200名烏克蘭專家,如今待遇怎么樣?我國做法非常貼心

      當年赴華的200名烏克蘭專家,如今待遇怎么樣?我國做法非常貼心

      瞻史
      2025-12-03 18:43:33
      海量大魚!美媒曬30隊TOP3交易籌碼:火箭隊無謝潑德快船哈登入選

      海量大魚!美媒曬30隊TOP3交易籌碼:火箭隊無謝潑德快船哈登入選

      鍋子籃球
      2025-12-18 22:08:11
      宋智孝炸鍋韓娛!自曝8年秘戀藏過跑男全員,劉在石驚到拍大腿!

      宋智孝炸鍋韓娛!自曝8年秘戀藏過跑男全員,劉在石驚到拍大腿!

      TVB的四小花
      2025-12-17 01:42:54
      4次撲點 6冠加身!俄羅斯門將封神之作:巴黎全隊致敬英雄

      4次撲點 6冠加身!俄羅斯門將封神之作:巴黎全隊致敬英雄

      葉青足球世界
      2025-12-18 08:41:33
      烏度卡被罰25000美元!公開抨擊裁判 加時賽3次誤判都是火箭吃虧

      烏度卡被罰25000美元!公開抨擊裁判 加時賽3次誤判都是火箭吃虧

      羅說NBA
      2025-12-18 05:31:53
      股票被套別躺平!主力自救法:10萬本金虧到5萬,反賺60%

      股票被套別躺平!主力自救法:10萬本金虧到5萬,反賺60%

      流蘇晚晴
      2025-12-18 18:35:55
      古力娜扎光腳丫好白嫩干凈

      古力娜扎光腳丫好白嫩干凈

      小椰的奶奶
      2025-12-18 08:40:43
      萬科開啟了第二筆中票展期

      萬科開啟了第二筆中票展期

      新浪財經
      2025-12-18 22:20:59
      美光科技盤前漲幅擴大至13.6%

      美光科技盤前漲幅擴大至13.6%

      每日經濟新聞
      2025-12-18 20:39:07
      怒了!董路全面開炮,硬剛6大前國腳:與孫繼海徹底撕破臉,大戰魯能系

      怒了!董路全面開炮,硬剛6大前國腳:與孫繼海徹底撕破臉,大戰魯能系

      林子說事
      2025-12-18 13:47:16
      你見過哪些因玩笑造成的慘劇?網友:就是給自己的惡找個借口罷了

      你見過哪些因玩笑造成的慘劇?網友:就是給自己的惡找個借口罷了

      帶你感受人間冷暖
      2025-12-17 00:05:19
      19:30,中國男足vs泰國!亞足聯送助攻,U23亞洲杯打進8強=創歷史

      19:30,中國男足vs泰國!亞足聯送助攻,U23亞洲杯打進8強=創歷史

      侃球熊弟
      2025-12-18 00:35:03
      深圳馬拉松“流氓私兔”事件13人被罰!網友:建議這類人全國禁賽

      深圳馬拉松“流氓私兔”事件13人被罰!網友:建議這類人全國禁賽

      復元體育
      2025-12-18 17:10:32
      美媒重排24屆選秀:卡斯爾狀元!周志豪成4號秀,雷霆次輪秀逆襲

      美媒重排24屆選秀:卡斯爾狀元!周志豪成4號秀,雷霆次輪秀逆襲

      你的籃球頻道
      2025-12-18 09:34:58
      俄領導人威脅稱,如果談判失敗,俄羅斯將“以武力”奪取領土

      俄領導人威脅稱,如果談判失敗,俄羅斯將“以武力”奪取領土

      山河路口
      2025-12-17 22:34:47
      54歲楊鈺瑩近況曝光:定居深圳,每天打理菜園子,生活平淡

      54歲楊鈺瑩近況曝光:定居深圳,每天打理菜園子,生活平淡

      小徐講八卦
      2025-11-17 07:29:28
      善惡終有報,被央視“除名”的海霞,新身份曝光令人唏噓

      善惡終有報,被央視“除名”的海霞,新身份曝光令人唏噓

      丁羂解說
      2025-12-18 04:05:59
      中央六提“漲工資”,所有央企還會“過苦日子”嗎?

      中央六提“漲工資”,所有央企還會“過苦日子”嗎?

      環球通信
      2025-12-18 20:12:56
      2025-12-18 23:16:49
      AI科技評論 incentive-icons
      AI科技評論
      點評學術,服務AI
      7012文章數 20715關注度
      往期回顧 全部

      科技要聞

      2025新一代人工智能創業大賽總決賽收官

      頭條要聞

      在野黨參議員問了句日本"存亡危機" 高市早苗瞬間冷臉

      頭條要聞

      在野黨參議員問了句日本"存亡危機" 高市早苗瞬間冷臉

      體育要聞

      紐約尼克斯,板正的球隊

      娛樂要聞

      絲芭放大招了!實名舉報鞠婧祎經濟犯罪

      財經要聞

      尹艷林:呼吁加快2.5億新市民落戶進程

      汽車要聞

      在零下30℃的考場里 凡爾賽C5 X和508L拿到了"穩"的證明

      態度原創

      親子
      游戲
      藝術
      教育
      公開課

      親子要聞

      當家爸爸的聚會,鮑家寨方言課開課,奶爸學方言笑翻全場,“你據撒起”教學開始啦~

      德瑪西亞杯:痛苦終于結束了,TT零封ZSM!

      藝術要聞

      卡洛斯·杜蘭:不只是薩金特的老師!

      教育要聞

      所謂教育,不過是三分說,七分等

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产女人高潮视频在线观看| 天堂中文在线资源| 色婷婷?av| 2025精品偷拍视频| 绝顶高潮videos合集| 男受被做哭激烈娇喘gv视频| 台北市| 亚洲男人在线| 好吊视频在线一区二区三区| 久久这里只有精品首页| 吴川市| 91在线视频播放| 国产精品毛片一区二区| 精品深夜av无码一区二区老年 | 亚洲五月天综合| 亚洲踪合一二三| 日韩久久中文字幕| 免费看无码自慰一区二区| 女人高潮流白浆视频| 欧洲高清无码| 99r久久| 蜜桃在线视频| a男人的天堂久久a毛片| av天堂永久资源网| 亚洲一区二区三区 无码| 操B小视频| 大色欧美| 三级片久久久| 日区中文字幕一区二区| 国产精品爽爽ⅴa在线观看| 夜夜添狠狠添高潮出水| www.jizz国产| 欧美阿V| 丝袜a片| 成人九九| 国产91丝袜在线观看| 国产做a爱免费视频在线观看| av色欲无码人妻中文字幕| 91丨九色丨人妻丨白浆| 荆门市| 亚洲五月综合|