公眾號記得加星標??,第一時間看推送不會錯過。
谷歌將繼續與英特爾合作,為其公共云購買 SmartNIC,而不是像 AWS 那樣自行開發 Nitro NIC。
與當今大多數超大規模數據中心運營商一樣,谷歌也采用了智能網卡(SmartNIC),或者如英特爾所稱的基礎設施處理單元(IPU)。這些設備本質上是網卡上的計算機,旨在卸載網絡、安全和存儲操作,從而釋放 CPU 資源以支持租戶工作負載。
亞馬遜采用其 Annapurna Labs 團隊的定制 ASIC,微軟使用在 FPGA 上運行的定制邏輯,而谷歌則委托英特爾開發了一款名為Mount Evans 的基于 ASIC 的 IPU ,該 IPU 于 2022 年與其 C3 實例一同推出。
周四,英特爾宣布谷歌已擴大與英特爾的合作,共同開發新的IPU。這份新聞稿讀起來像是英特爾孤注一擲地試圖說服公眾,其數據中心和網絡部門仍然具有重要意義。
英特爾首席財務官大衛·津斯納在1月份的公司第四季度財報電話會議上曾暗示對這些服務的需求增加,并吹噓公司定制ASIC業務在2025年增長超過50%,并在第四季度末實現了超過10億美元的年化收入。
英特爾沒有詳細說明谷歌的下一代 IPU 可能是什么樣子,但考慮到人工智能計算集群對高速網絡的需求,它很有可能比其 200 Gbps 的埃文斯山 IPU 快得多。
除了擴大與IPU的合作之外,英特爾也強調,這家“巧克力工廠”并沒有放棄其至強處理器,這些處理器將繼續為各種通用和人工智能工作負載提供動力。換句話說,一切照常進行。
與許多超大規模數據中心一樣,谷歌現在擁有了自己的基于 Arm 架構的 CPU,代號為Axion,用于運行內部和面向客戶的工作負載。
然而,正如 Graviton 和 Cobalt 已經取代了亞馬遜或微軟云中的 Xeon 或 Epyc 處理器一樣,英特爾和 AMD 近期內都不會面臨被 Axion 淘汰的風險。
事實上,由于許多客戶出于性能或兼容性原因更喜歡在 x86 內核上運行工作負載,因此英特爾仍然有助于對 AMD 施加價格壓力,反之亦然。
總之,英特爾認為有必要向所有人保證,至強處理器仍然是谷歌云的關鍵組成部分,尤其是在人工智能領域。但話說回來,這并非什么新鮮事。
自 2022 年的 H100 以來,至強處理器一直是英偉達 8 GPU DGX 參考設計的首選 CPU。換句話說,谷歌的許多 GPU 實例內部已經使用了英特爾的處理器。
而且,雖然人工智能工作負載也需要 CPU 來協調代理并執行由谷歌 GPU 和 TPU 生成的代碼,但 Xeon 本身并沒有任何優勢比 Epyc 或 Axion 更適合這項工作。事實上,在云規模下,最適合代理式人工智能的 CPU 可能就是任何給定時刻恰好處于空閑狀態的 CPU。
英特爾和谷歌深化合作
英特爾公司(納斯達克股票代碼:INTC)和谷歌今天宣布了一項多年合作計劃,旨在推進下一代人工智能和云基礎設施的發展,并強化CPU和定制基礎設施處理單元(IPU)在擴展現代異構人工智能系統中的關鍵作用。
隨著人工智能的快速普及,基礎設施變得日益復雜和異構,對CPU在編排、數據處理和系統級性能方面的依賴性也越來越高。通過此次合作,英特爾和谷歌將整合多代英特爾? 至強? 處理器,以提升谷歌全球基礎設施的性能、能效和總體擁有成本。
人工智能并非僅靠加速器運行,而是運行在系統之上。而CPU則是這些系統的核心。
谷歌云持續在其工作負載優化實例中部署英特爾至強處理器,包括為 C4 和 N4 實例提供動力的最新英特爾至強 6 處理器。這些平臺支持廣泛的工作負載,從大規模 AI 訓練協調到對延遲敏感的推理和通用計算。
與此同時,英特爾和谷歌正在擴大基于ASIC的定制化IPU的聯合開發。這些可編程加速器將網絡、存儲和安全功能從主機CPU卸載,從而提高CPU利用率、提升效率,并在超大規模AI環境中實現更可預測的性能。
IPU 是現代數據中心架構的關鍵組件。它們能夠處理傳統上由 CPU 管理的底層架構任務,從而釋放更大的有效計算能力,并使云服務提供商能夠在不增加整體系統復雜性的情況下更高效地擴展。Xeon CPU 和 IPU 共同構成了一個緊密集成的平臺,該平臺兼顧通用計算和專用的底層架構加速,從而提供更高效、更靈活、更具可擴展性的 AI 系統。
英特爾首席執行官陳立步表示:“人工智能正在重塑基礎設施的構建和擴展方式。擴展人工智能需要的不僅僅是加速器,還需要均衡的系統。CPU 和 IPU 對于提供現代人工智能工作負載所需的性能、效率和靈活性至關重要。”
谷歌人工智能基礎設施高級副總裁兼首席技術官Amin Vahdat表示:“CPU和基礎設施加速仍然是人工智能系統的基石——從訓練編排到推理和部署。英特爾近二十年來一直是值得信賴的合作伙伴,他們的至強處理器路線圖讓我們有信心能夠繼續滿足我們工作負載日益增長的性能和效率需求。”
此次擴展合作體現了雙方共同致力于推進面向人工智能時代的開放、可擴展基礎設施的決心。通過將通用計算與專用基礎設施加速相結合,英特爾和谷歌正在推動一種更加平衡的人工智能系統設計方法——這種方法能夠提高資源利用率、降低復雜性并更高效地擴展。
兩家公司攜手合作,正在加強下一代人工智能驅動型云服務的基礎,從而支持全球企業、開發者和用戶的持續創新。
(來源:半導體行業觀察綜合)
*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支持,如果有任何異議,歡迎聯系半導體行業觀察。
今天是《半導體行業觀察》為您分享的第4372內容,歡迎關注。
加星標??第一時間看推送
![]()
![]()
求推薦
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.