![]()
自動化測試喊了很多年,真正落地時總卡在兩件事上:寫代碼的門檻太高,腳本維護太費勁。Microsoft Edge QA 團隊最近開源的 AutoGenesis,思路挺有意思——讓測試人員用自然語言描述場景,AI 負責生成代碼,但執行環節完全交給確定性的程序。說白了,AI 被關在籠子里干活,只動嘴不動手。
Edge 瀏覽器基于 Chromium 開發,跟著 Chrome 的節奏高頻發版。每次 Chromium 更新都像開盲盒,回歸測試量極大。團隊試過讓 AI 直接執行測試,結果發現不行:步驟多了 AI 會忘上下文,遇到彈窗可能陷入死循環,判斷測試結果更是黑盒操作。"就像讓一個人蒙眼走夜路,偶爾走對,但你不敢信。"
AutoGenesis 的解法是把 AI 和執行徹底切開。四層架構里,AI 只在第二層(LLM 層)活動,把 Gherkin 格式的自然語言翻譯成 MCP 工具調用序列,生成 Python 步驟定義代碼。真正的執行交給第四層的 Behave 框架,完全不碰 AI 推理。
![]()
這個設計讓 Edge 團隊的外包人員也能參與自動化建設——他們懂業務、會設計用例,但不會編程。FTE 工程師搭好工具鏈,外包同事用自然語言寫場景,AI 生成代碼。數據顯示,外包團隊已貢獻 413 個 PR,月執行步驟 200 萬+,通過率 99%。
技術實現上,AutoGenesis 用 MCP 協議封裝跨平臺能力:Windows 走 PyWinauto,iOS/Android/macOS 走 Appium。代碼生成環節設計了三階段 Preview-Confirm 流程,人類在確認前始終掌握審查權。執行層用 janus.Queue 解決 Behave 同步與 MCP 異步的橋接問題,超時 400 秒的兜底機制保證穩定性。
使用路徑有兩條:VS Code 擴展提供可視化界面,GitHub Copilot Skill 支持命令行調用。擴展不是必須的,核心能力完全獨立存在。
![]()
單場景編寫時間從 2-3 小時壓到 10-15 分鐘,后續執行零 AI 調用成本。一套技術棧覆蓋四大平臺,告別各端獨立維護的噩夢。
Edge 團隊把這套方案開源在 GitHub,MIT 協議。不是炫技,是在真實業務里磨出來的務實解法——AI 降低門檻,架構保證穩定,兩者缺一不可。
有個細節挺能說明問題:外包同事第一次用自然語言寫完場景,看到 AI 生成的可執行代碼時,反應是"原來我也能做自動化"。這個反饋比任何技術參數都更直接地解釋了 AutoGenesis 的設計初衷。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.