<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      100行代碼打造迷你編程Agent:修復65%真項目bug,適配所有大模型

      0
      分享至

      只用100行代碼,打造最強輕量編程agent。

      SWE-bench、SWE-agent原班人馬再出手,推出全新開源項目——

      mini-SWE-agent



      不依賴任何額外插件,僅通過基礎命令即可運行。而且對模型沒有限制,幾乎兼容所有主流語言模型,支持直接在本地終端中部署和使用。

      而在如此精簡的架構下,僅憑100行核心代碼輕松解決SWE-bench上65%的問題。

      這個65%是啥水平呢?

      也就和原版差不多吧~(關鍵人家還輕量啊)



      網友:厲害



      百行代碼,實力不打折

      SWE-agent是一個開源項目(16.8k GitHub Star),它的目標是讓agent自動修復GitHub上真實項目中的代碼Bug



      不過,原版的SWE-agent基于LangChain構建,從接受issue、理解問題、編輯代碼、到提交PR,涉及多工具、多輪對話管理,任務流程繁瑣。

      除此之外,開發者要跑通還需要安裝多個依賴,精調工具調用邏輯,而且項目代碼動輒上千行,對模型、環境的耦合也比較強。

      而隨著語言模型性能越來越強大,構建一個有用的代理已經不再需要這些工具和接口了。

      由此,團隊開始思考:能否讓SWE-agent小100倍,并保持原有的性能。

      mini-SWE-agent由此而來。



      那么,相較于SWE-agent,mini-SWE-agent有什么不同呢?

      極簡代碼和依賴:mini-SWE-agent本身僅約100行Python代碼,加上環境、模型、腳本才共約200行,沒有復雜的依賴關系。

      取消工具調用接口:mini版本不集成專用的代碼編輯、搜索等工具;它只使用操作系統的Bash環境執行命令。每一步由語言模型輸出一個完整的shell命令,不通過獨立的“tool call”協議,從而可兼容任何語言模型。

      線性歷史記錄:agent的每一步都只是附加到消息中。

      獨立單步執行:每條命令通過Python獨立執行,并非保持一個持續的shell會話,這使得在沙盒中執行操作變得非常簡單,并且可以輕松擴展。

      簡化配置與接口:取消了SWE-agent依賴的復雜YAML配置;mini-swe-agent采用代碼內置模板,并提供直觀的命令行工具。用戶可以通過mini命令快速啟動代理,或使用mini-v啟動可視化界面。



      多樣的運行環境支持:除了本地Shell,mini-swe-agent還內置支持多種容器與虛擬化環境(如Docker、Podman、Singularity、Apptainer等),這意味著開發者可以在不同平臺和容器中輕松部署,而無需額外修改代碼。

      保留高性能和工具:雖然架構極簡,mini-swe-agent在SWE-bench驗證集上仍能解決約65%的問題。同時,它附帶批量推理(batchinference)、軌跡瀏覽器(trajectorybrowser)等工具,幫助用戶進行大規模評測和決策分析。代理還提供可視化界面,方便開發者交互式地觀察執行過程



      此外,對于應在何種場景下使用 SWE-agent 或 mini-SWE-agent,團隊也根據不同的需求給出了建議:

      mini-swe-agent更適合希望快速本地運行、追求簡潔控制流和更穩定評估環境的用戶。它非常輕量,適合用于微調(FT)或強化學習(RL)等實驗,不容易陷入對復雜框架的過擬合。

      如果你需要高度可配置的工具鏈、更復雜的歷史狀態管理,或希望通過修改YAML文件自由切換組件而無需動代碼,那么功能更豐富的SWE-agent會是更合適的選擇。

      總體而言,mini-swe-agent體現了可讀、方便、易擴展的開發理念。

      對于日常開發者而言,它既可以作為簡單的命令行工具使用。如在本地終端快速解決問題),也可以作為庫被集成到其他Python應用中。

      相比于重型框架,它降低了上手成本,讓開發者可以像使用腳本一樣靈活地“駕馭”智能代理。

      One more thing

      SWE-bench和SWE-agent是由John Yang、Carlos E. Jimenez、Alexander Wettig、Kilian Lieret、姚順雨(OpenAI研究員,2015年畢業清華姚班)、Karthik Narasimhan和Ofir Press于2024年在普林斯頓大學發起的開源項目。

      該項目推動了基于大型語言模型的軟件工程代理(Software Engineering Agent)研究。

      其中,SWE-bench一經發布后,就成為了評估大語言模型編程的經典benchmark,伴隨SWE-agent一同提出的Agent?Computer-Interface(ACI)則進一步定義了“智能體如何與計算機交互”的標準接口方式。

      而這一杰出的想法最初僅僅來自一次20多分鐘的討論。

      在Matthew Berman的播客節目上,Carlos E. Jimenez分享道:SWE-bench最初的想法源自他和John Yang在閑逛時的一次頭腦風暴:



      他們意識到,GitHub不只是一個存儲代碼的地方,更是一個活躍的協作開發平臺,充滿了真實的軟件工程過程:用戶報告bug,開發者提交修復,社區公開審核和合入。

      相比傳統的編程競賽,這些交互和修改才是真正代表“現實世界編程”的任務。于是他們設想,能否把這種開源協作的過程結構化下來,變成一種評估語言模型能力的標準流程?

      這便催生了SWE-bench,一個基于GitHub上真實Issue與PullRequest構建的benchmark,用來測試LLM是否能像人類開發者一樣,理解bug報告并修復代碼。

      這個系統不僅更接近現實,也讓模型的“開發能力”變得可觀察、可比較,而SWE-agent則是他們為這一評估任務設計的開源agent,目標就是成為能在SWE-bench上“修最多bug”的AI程序員。

      項目主頁:
      [1]https://github.com/SWE-agent/mini-swe-agent
      [2]https://github.com/SWE-agent/mini-swe-agent?tab=readme-ov-file

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      沐曦接力造富:股民中一簽賺36萬,梁文鋒大賺4500萬,私募大佬葛衛東收益翻17倍

      沐曦接力造富:股民中一簽賺36萬,梁文鋒大賺4500萬,私募大佬葛衛東收益翻17倍

      搜狐科技
      2025-12-17 17:28:42
      豬肝再次成為關注對象!醫生發現:常吃豬肝,可能會收獲4大好處

      豬肝再次成為關注對象!醫生發現:常吃豬肝,可能會收獲4大好處

      搖感軍事
      2025-11-30 18:57:30
      26歲女子顏值秒殺女明星,男子相中才知東莞工作,要求男方月薪1.5w

      26歲女子顏值秒殺女明星,男子相中才知東莞工作,要求男方月薪1.5w

      趣筆談
      2025-12-16 22:57:31
      1949年南京解放,一位只懂搓麻將的闊太太走向軍部,報出一個名字后,政委當場敬禮,鄰居手里的菜都嚇掉了

      1949年南京解放,一位只懂搓麻將的闊太太走向軍部,報出一個名字后,政委當場敬禮,鄰居手里的菜都嚇掉了

      文史明鑒
      2025-12-12 20:47:14
      特朗普:我宣布將它定性為“大規模殺傷性武器”

      特朗普:我宣布將它定性為“大規模殺傷性武器”

      看看新聞Knews
      2025-12-16 17:04:10
      第一批免簽去俄羅斯的中產,傻眼了

      第一批免簽去俄羅斯的中產,傻眼了

      旅界Pro
      2025-12-15 08:35:24
      南京城市隊首筆重量級引援敲定,特謝拉有望加盟,已跟著主帥亮相

      南京城市隊首筆重量級引援敲定,特謝拉有望加盟,已跟著主帥亮相

      懂個球
      2025-12-17 16:26:10
      房產證上的人去世了,繼承別再花大幾千的公證費,80塊錢就能搞定

      房產證上的人去世了,繼承別再花大幾千的公證費,80塊錢就能搞定

      室內設計師有料兒
      2025-12-07 16:05:28
      將“55寸電視”換成85寸后,有些話我不吐不快,太扎心了!

      將“55寸電視”換成85寸后,有些話我不吐不快,太扎心了!

      家電小超人
      2025-12-16 16:35:03
      老公屬這3生肖,別嫌當下窮,日子生財有道,錢財不缺

      老公屬這3生肖,別嫌當下窮,日子生財有道,錢財不缺

      人閒情事
      2025-12-16 15:37:48
      10人聚餐逃單后續:10人已社死,組局人身份被扒,張某正臉照曝光

      10人聚餐逃單后續:10人已社死,組局人身份被扒,張某正臉照曝光

      不寫散文詩
      2025-12-17 19:22:27
      何晴葬禮現場曝光!不到24小時,許亞軍一個舉動實現口碑暴漲

      何晴葬禮現場曝光!不到24小時,許亞軍一個舉動實現口碑暴漲

      冷紫葉
      2025-12-16 13:10:08
      價格過高可能不是主要原因,印度決定放棄美國19億美元NASAMS協議

      價格過高可能不是主要原因,印度決定放棄美國19億美元NASAMS協議

      止戈軍是我
      2025-12-17 22:17:54
      事實證明!陪馬克龍回國的鞏俐,可能已經走上了另一條大道

      事實證明!陪馬克龍回國的鞏俐,可能已經走上了另一條大道

      夢史
      2025-12-13 11:46:11
      運-30首飛成功,將成為世界最強戰術運輸機嗎?

      運-30首飛成功,將成為世界最強戰術運輸機嗎?

      世家寶
      2025-12-17 15:22:48
      繼續下滑,奧納納身價再降500萬歐至1500萬歐

      繼續下滑,奧納納身價再降500萬歐至1500萬歐

      懂球帝
      2025-12-17 22:36:06
      中國已經提前準備好,開戰之后的第一件事,先廢掉美國的“星鏈”

      中國已經提前準備好,開戰之后的第一件事,先廢掉美國的“星鏈”

      科普100克克
      2025-12-17 01:07:54
      童瑤胸貼露出來了

      童瑤胸貼露出來了

      手工制作阿殲
      2025-12-15 12:20:21
      63歲張凱麗扮嫩翻車!頭發和蘋果肌都是假的,皺紋全堆眼睛上了

      63歲張凱麗扮嫩翻車!頭發和蘋果肌都是假的,皺紋全堆眼睛上了

      丁丁鯉史紀
      2025-12-16 11:01:13
      中國曝光關鍵武器!美俄都沒攻克的世界難題,被中國80歲老頭拿下

      中國曝光關鍵武器!美俄都沒攻克的世界難題,被中國80歲老頭拿下

      策略述
      2025-12-16 16:21:07
      2025-12-17 23:03:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      11868文章數 176338關注度
      往期回顧 全部

      科技要聞

      特斯拉值1.6萬億靠畫餅 Waymo值千億靠跑單

      頭條要聞

      捐贈博物館價值8800萬的名畫現身拍賣市場 捐贈方發聲

      頭條要聞

      捐贈博物館價值8800萬的名畫現身拍賣市場 捐贈方發聲

      體育要聞

      短短一年,從爭冠到0勝墊底...

      娛樂要聞

      狗仔曝熱播劇姐弟戀真談了???

      財經要聞

      重磅信號!收入分配制度或迎重大突破

      汽車要聞

      一車多動力+雙姿態 長城歐拉5上市 限時9.18萬元起

      態度原創

      時尚
      家居
      房產
      教育
      游戲

      這才是50歲女人該有的冬季穿搭,既保暖又體面,想不優雅都難

      家居要聞

      溫馨獨棟 駝色與淺色碰撞

      房產要聞

      封關前夕!豪庭銘苑超前交付,敬呈海口生活新范本

      教育要聞

      明早9點,“三尺之外”城市教育談正式開講!點這里預約直播

      地表最強帕魯誕生!幻獸帕魯全新版本上線,新裝備特效太強了

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 欧美性猛交xxxx乱大交丰满| 国产综合色网| 国产精品视频全国免费观看| 欧美深度肠交惨叫| 国产午夜视频在线观看| 国产无码一区二区| 国产成人无码AV片在线观看不卡| 艳妇荡女欲乱双飞两中年熟妇| 国产午夜视频在线观看| 玉山县| 精品国产乱子伦一区二区三区,精品一| 偷拍精品一区二区三区| 国产av国片精品有毛| 日韩欧美卡一卡二卡新区| 91碰碰| 国产精品免费无遮挡无码永久视频| 国产妇女馒头高清泬20p多毛| 欧美性受xxxx黑人猛交| 国产色视频一区二区三区| 91福利姬| 久久婷婷五月综合| 欧美AA视频| 干老熟女干老穴干老女人| 日韩在线视频观看免费网站| 久久精品国产精品亚洲蜜月| 欧洲AV在线| 金乡县| 国产网曝门| 久久婷婷五月天| 人妻少妇精品无码专区二区| 欧美日韩亚洲国产| 另类 专区 欧美 制服丝袜| 少妇粉嫩小泬白浆流出| 天堂人妻熟妇一区二区不卡| 欧美色资源站| 昭平县| 久热av性爱在线观看| 亚洲精品国产美女久久久| 亚洲欧美综合中文| 毛片24种姿势无遮无拦| 欧美日韩精品一区二区三区在线|