公眾號記得加星標??,第一時間看推送不會錯過。
在最近一次RISC-V 峰會上,谷歌數據中心性能工程總監 Martin Dixon 發表了一場精彩的演講。他以谷歌成功過渡到基于 ARM 的服務器為例,帶領聽眾進行了一次“公路旅行”,探討了谷歌將 RISC-V 集成到其龐大的倉庫級計算基礎設施中的愿景。Dixon 概述了將 RISC-V 應用于數據中心規模所面臨的機遇、挑戰和必要條件。
谷歌的異構計算之旅始于其基于通用 x86 平臺的早期階段,并在不斷變化的需求中迎來了 27 周年紀念。2010 年代中期,該公司開始嘗試 ARM 架構,并遵循了 2014 年發布的 ARM 服務器規范。這促成了 2022 年 Tau T2A ARM 實例的推出,以及最近推出的定制 Axion ARM 處理器。如今,谷歌的數據中心已經混合部署了 x86、ARM 和新興架構,包括早期的 RISC-V 組件。Dixon強調,異構性和專業化對于克服摩爾定律放緩至關重要,能夠實現規模化更高的效率和性能。
RISC-V 的開放性和定制潛力令人興奮,但 Dixon 也警告說,如果沒有標準,它就是一把“雙刃劍”。他強調,需要像 RVA23 規范和即將發布的 RISC-V 服務器平臺規范這樣的基準,以確保倉庫級部署的兼容性。
Dixon以公路旅行為例,概述了成功的關鍵“要素”:
路線圖——標準化規范,強制功能包括分支記錄(類似于英特爾的 LBR 或 ARM 的 BRBE)、側信道加固加密和 MMU 支持等,以確保安全。
一款酷炫的汽車——高性能服務器級SoC,至少有64個核心,每個核心支持4GB以上的內存,優先考慮性能、可靠性和可維護性。
碧昂絲——這是對谷歌內部“碧昂絲法則”(出自碧昂絲的歌曲《Single Ladies》:“如果你喜歡它,就應該測試它”)的幽默致敬。Dixon強調,關鍵功能必須經過全面的測試,以簡化多架構移植。
朋友們——強大的社區協作,打造“開箱即用、編譯運行”的強大軟件生態系統。
回顧移植到 ARM 架構的經驗,Dixon 分享道,谷歌的主要工作負載(包括 YouTube、Spanner 和 BigQuery)幾乎占其計算資源的一半。移植不僅僅關乎大型服務——調度器需要大小作業混合打包才能實現高效運行。谷歌通過集中協作、自動化和 AI 生成的變更,移植了超過 3 萬個軟件包,從而為大量工作負載提供了自助服務。
開發者們對工具鏈崩潰的擔憂最終被證明是多余的;問題大多是一些“瑣碎”的小問題,例如配置文件、構建路徑和不穩定的測試。少數小問題包括浮點精度差異(已通過標準化為 float128 解決)和一些極少的內存排序錯誤。總的來說,過渡過程比預期的要順利得多。
展望未來,谷歌正通過 RISC-V 國際組織參與 QoS 和 RVA23 等標準的制定,并作為 RISE 的創始成員,加速 Linux 和 LLVM 的上游開發。為了實現流程的“自動化”,谷歌將其 Gemini AI 模型應用于 4 萬個 ARM 移植修改,并對其進行分類,以便未來自動執行更改。現在,AI 代理負責安全、漸進地進行部署,團隊往往難以察覺。
對于 RISC-V,Dixon呼吁批準服務器規范、交付功能強大的片上系統 (SoC)、擴大測試覆蓋范圍并擁抱人工智能。谷歌通過 RISE 和 RISC-V International,利用 Gemini 計劃的資助金資助學術界人士推進人工智能驅動的移植工作。
Dixon樂觀地引用杰克·凱魯亞克的名言結束了演講:讓我們“滿懷熱情地迎接下一個挑戰”,利用RISC-V實現倉庫級規模的計算。他的演講凸顯了谷歌對開放架構的承諾,并將RISC-V定位為未來超大規模計算的關鍵支柱。
https://semiwiki.com/ip/risc-v/364961-googles-road-trip-to-risc-v-at-warehouse-scale-insights-from-googles-martin-dixon/
(來源:編譯自semiwiki)
*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支持,如果有任何異議,歡迎聯系半導體行業觀察。
今天是《半導體行業觀察》為您分享的第4265期內容,歡迎關注。
加星標??第一時間看推送,小號防走丟
求推薦
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.