亞馬遜旗下云計算部門近期至少兩次因自家人工智能編碼工具出錯而發生服務中斷事件,一些員工因此對這家美國科技巨頭大力推廣相關工具的策略產生疑慮。據知情人士透露,去年12月中旬,亞馬遜云服務(AWS)一套供客戶分析服務成本的系統曾出現長達約13小時的中斷。
事件起因是工程師允許其Kiro AI編碼工具對系統進行某些變更,這一具備自主行動能力的“智能代理”在執行任務時判斷,解決問題的最佳方式是“刪除并重建環境”,結果導致系統不可用。 AWS事后在內部發布了針對這起“宕機”事件的復盤報告。
![]()
多名亞馬遜員工表示,這是近幾個月內集團AI工具第二次處于服務中斷事件的中心位置。 一名AWS高層員工稱,“過去幾個月我們已經看到至少兩次生產環境宕機”,原因在于工程師允許AI代理在無人干預的情況下自行處理問題,“這些宕機規模不大,但完全在預料之中”。
AWS目前正積極研發和部署包括“智能代理”在內的多種AI工具,希望它們能夠基于人類指令自主采取行動,并向外部客戶銷售這類技術。 這些事件凸顯出新生代AI工具在真實生產環境中可能出現“跑偏”,從而引發服務中斷的風險。 亞馬遜方面則回應稱,AI工具“卷入其中純屬巧合”,“同樣的問題完全可能出現在任何開發者工具或人工手動操作中”,并強調“這兩起事件都屬于用戶錯誤,而非AI錯誤”,目前沒有證據顯示使用AI工具比傳統方式更容易出錯。
公司表示,去年12月的事故屬于“極其有限的事件”,僅影響到中國大陸部分地區的一項單一服務。 至于另一事件,亞馬遜稱并未對任何“面向客戶的AWS服務”造成影響。 相比之下,2025年10月那次持續約15小時的大規模AWS宕機更為嚴重,當時包括OpenAI的ChatGPT在內的多家客戶應用和網站被迫下線,本次兩起中斷的嚴重程度都遠不及那次事故。
有員工透露,集團內部在權限管理上,將這些AI工具視作操作員的延伸,并賦予與人工操作相同級別的權限。 在上述兩起事件中,相關工程師在允許系統改動時,并未按常規流程要求第二人復核批準。 亞馬遜表示,Kiro工具在默認情況下“在采取任何行動前都會請求授權”,但12月事故中涉事工程師所擁有的權限“超出了原本預期”,屬于“用戶訪問控制問題,而非AI自主性問題”。
AWS于去年7月正式推出Kiro,宣稱這一編碼助手將超越所謂“vibe coding”(更偏向快速試驗式搭建應用),轉向根據明確的技術規格自動生成代碼。 在此之前,集團主要依賴Amazon Q Developer這一內置AI功能的聊天機器人為工程師提供代碼編寫輔助。 三名員工稱,早前那起宕機事件正是與該工具相關。
盡管公司持續加碼,仍有部分亞馬遜員工對AI工具在日常大部分工作場景中的實際價值持懷疑態度,理由正是潛在的錯誤風險。 他們表示,公司已經設定目標:要求80%的開發者每周至少一次在編碼任務中使用AI工具,并對使用率進行密切跟蹤。 亞馬遜則強調,Kiro在客戶群體中表現出強勁的增長勢頭,公司希望客戶和員工都能從效率提升中受益。 公司補充稱,在去年12月事件之后,AWS已經實施了多項“安全防護措施”,包括強制同行評審以及相關人員培訓等,以降低類似事故再度發生的可能性。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.