![]()
Snowflake本周推送的一次更新導致全球范圍內出現"重大故障",許多用戶無法查詢數據,文件導入失敗,并持續13小時收到錯誤消息,該公司在影響聲明中寫道。
"我們的初步調查發現,最新版本引入了一個向后不兼容的數據庫架構更新,"該公司在事故報告中寫道。"因此,之前的發布包錯誤地引用了更新后的字段,導致版本不匹配錯誤,造成操作失敗或需要很長時間才能完成。"
此次更新導致Snowflake全球23個區域中的10個區域服務中斷。在美國,故障影響了訪問其位于弗吉尼亞州Azure數據中心和俄勒岡州AWS數據中心的大量客戶。在全球范圍內,愛爾蘭、蘇黎世、倫敦、瑞典、孟買、新加坡和墨西哥數據中心的用戶均受到影響。
故障首次報告時間是周二UTC時間02:55,當時客戶查詢其數據時返回SQL執行錯誤。
大約一個半小時后,Snowflake表示已經識別出問題并正在修復。到UTC時間05:00左右,系統恢復正常運行。
"我昨天就遇到了這個問題,"一位用戶在Snowflake的Reddit頁面上抱怨道。"他們回滾這個變更花了太長時間。"
該公司表示將在關閉事件后五天內發布根本原因分析報告,預計在周日完成。
"我們目前沒有更多信息可以分享,"一位發言人告訴The Register。
這是Snowflake一周內的第二次事故。根據其狀態頁面顯示,12月10日,數據庫基礎設施問題導致使用俄勒岡州AWS數據中心的用戶遭遇性能下降。
Snowflake并非本月唯一出現問題的數據平臺。
在12月11日至13日期間,Snowflake的主要競爭對手Databricks經歷了長達數天的服務中斷,美國多個區域的客戶在使用Mosaic AI(該公司用于構建智能體的助手)時遇到延遲或錯誤,問題僅限于使用該公司在美國七個地區Azure數據中心的用戶。
在此之前的12月3日,US Gov West AWS區域的客戶遭遇了"完全中斷,所有Databricks服務均無法使用"的情況,持續約兩小時。
與Snowflake在事件頁面上列出故障初步原因并跟進根本原因分析不同,Databricks不公布其故障原因。
Databricks未回應The Register的置評請求。
Q&A
Q1:Snowflake這次全球故障的原因是什么?
A:Snowflake最新版本引入了一個向后不兼容的數據庫架構更新,導致之前的發布包錯誤地引用了更新后的字段,造成版本不匹配錯誤,使操作失敗或需要很長時間才能完成。故障影響了全球23個區域中的10個,持續約13小時。
Q2:哪些地區的Snowflake用戶受到了影響?
A:在美國,訪問弗吉尼亞州Azure數據中心和俄勒岡州AWS數據中心的客戶受到影響。在全球范圍內,使用愛爾蘭、蘇黎世、倫敦、瑞典、孟買、新加坡和墨西哥數據中心的用戶均遭遇服務中斷。
Q3:Databricks最近是否也出現過類似的服務故障?
A:是的,12月11日至13日期間,Databricks經歷了長達數天的服務中斷,美國多個區域的客戶在使用Mosaic AI時遇到延遲或錯誤。12月3日,US Gov West AWS區域還出現了約兩小時的完全中斷。但與Snowflake不同,Databricks不公布故障原因。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.