網易首頁 > 網易號 > 正文申請入駐

微軟把AI關進籠子：生成代碼可以，執行免談

2026-03-26 11:56:56　來源: 灰度測試中

北京舉報

分享至

自動化測試喊了很多年，真正落地時總卡在兩件事上：寫代碼的門檻太高，腳本維護太費勁。Microsoft Edge QA 團隊最近開源的 AutoGenesis，思路挺有意思——讓測試人員用自然語言描述場景，AI 負責生成代碼，但執行環節完全交給確定性的程序。說白了，AI 被關在籠子里干活，只動嘴不動手。

Edge 瀏覽器基于 Chromium 開發，跟著 Chrome 的節奏高頻發版。每次 Chromium 更新都像開盲盒，回歸測試量極大。團隊試過讓 AI 直接執行測試，結果發現不行：步驟多了 AI 會忘上下文，遇到彈窗可能陷入死循環，判斷測試結果更是黑盒操作。"就像讓一個人蒙眼走夜路，偶爾走對，但你不敢信。"

AutoGenesis 的解法是把 AI 和執行徹底切開。四層架構里，AI 只在第二層（LLM 層）活動，把 Gherkin 格式的自然語言翻譯成 MCP 工具調用序列，生成 Python 步驟定義代碼。真正的執行交給第四層的 Behave 框架，完全不碰 AI 推理。

這個設計讓 Edge 團隊的外包人員也能參與自動化建設——他們懂業務、會設計用例，但不會編程。FTE 工程師搭好工具鏈，外包同事用自然語言寫場景，AI 生成代碼。數據顯示，外包團隊已貢獻 413 個 PR，月執行步驟 200 萬+，通過率 99%。

技術實現上，AutoGenesis 用 MCP 協議封裝跨平臺能力：Windows 走 PyWinauto，iOS/Android/macOS 走 Appium。代碼生成環節設計了三階段 Preview-Confirm 流程，人類在確認前始終掌握審查權。執行層用 janus.Queue 解決 Behave 同步與 MCP 異步的橋接問題，超時 400 秒的兜底機制保證穩定性。

使用路徑有兩條：VS Code 擴展提供可視化界面，GitHub Copilot Skill 支持命令行調用。擴展不是必須的，核心能力完全獨立存在。

單場景編寫時間從 2-3 小時壓到 10-15 分鐘，后續執行零 AI 調用成本。一套技術棧覆蓋四大平臺，告別各端獨立維護的噩夢。

Edge 團隊把這套方案開源在 GitHub，MIT 協議。不是炫技，是在真實業務里磨出來的務實解法——AI 降低門檻，架構保證穩定，兩者缺一不可。

有個細節挺能說明問題：外包同事第一次用自然語言寫完場景，看到 AI 生成的可執行代碼時，反應是"原來我也能做自動化"。這個反饋比任何技術參數都更直接地解釋了 AutoGenesis 的設計初衷。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.