IBM宣布即將全面推出IBM Spyre Accelerator,這是一款AI加速器,能夠實現低延遲推理,以支持生成式AI和代理AI應用,同時優先考慮核心工作負載的安全性和彈性。今年早些時候,IBM宣布Spyre加速器將在IBM z17、LinuxONE 5和Power11系統中提供。Spyre將于10月28日在IBM z17和LinuxONE 5系統上正式上市,并于12月初在Power11服務器上推出市場。
![]()
今天的IT環境正在從傳統的邏輯工作流程轉變為代理人工智能推理。AI代理需要低延遲推理和實時系統響應。IBM認識到,大型機和服務器需要在不影響吞吐量的情況下運行人工智能模型以及最苛刻的企業工作負載。為了滿足這一需求,客戶需要支持生成和代理人工智能的人工智能推理硬件,同時保持核心數據、交易和應用程序的安全性和彈性。該加速器還旨在使客戶能夠將關鍵任務數據保存在本地,以降低風險,同時解決運營和能源效率問題。
IBM Spyre加速器反映了IBM從研究到產品的實力,將IBM研究AI硬件中心的突破性創新與IBM Infrastructure的企業級開發相結合。Spyre最初是作為原型芯片推出的,通過快速迭代進行了改進,包括在IBM約克敦高地校區的集群部署,以及與奧爾巴尼大學新興人工智能系統中心等合作伙伴的合作。
![]()
IBM Research原型已經發展成為一種企業級產品,用于IBM Z、LinuxONE和Power系統。如今,Spyre加速器作為一個商用片上系統,擁有32個獨立的加速器內核和256億個晶體管。每個Spyre采用5nm節點技術生產,安裝在75瓦的PCIe卡上,這使得在IBM Z或LinuxONE系統中最多可以集群48張卡,或者在IBM Power系統中集群16張卡,以擴展AI功能。
“我們的一個關鍵優先事項是推進基礎設施建設,以滿足新興人工智能工作負載的需求,”IBM基礎設施首席運營官兼IBM系統總經理Barry Baker說。“借助Spyre Accelerator,我們正在擴展系統的功能,以支持多模型人工智能,包括生成和代理人工智能。這項創新使客戶能夠以毫不妥協的安全性、彈性和效率擴展其支持人工智能的關鍵任務工作負載,同時釋放其企業數據的價值。”
“我們于2019年成立了IBM研究人工智能硬件中心,其使命是滿足人工智能不斷增長的計算需求,甚至在我們最近看到的LLM和人工智能模型激增之前,”IBM半導體總經理兼IBM混合云副總裁Mukesh Khare說。“現在,在對先進人工智能功能的需求不斷增加的情況下,我們很自豪地看到該中心的第一個芯片進入商業化階段,旨在為IBM的大型機和服務器客戶端提供更高的性能和生產力。”
對于IBM客戶,Spyre加速器通過本地AI加速提供快速、安全的處理。這標志著一個重要的里程碑,使企業能夠大規模利用人工智能,同時保留IBM Z、LinuxONE和Power系統上的數據。在大型機系統中,結合用于IBM Z和LinuxONE的Telum II處理器,Spyre提供了增強的安全性、低延遲和高事務速率處理能力。利用這種先進的硬件和軟件堆棧,企業可以使用Spyre擴展多個AI模型,以支持高級欺詐檢測和零售自動化等商業預測用例。
![]()
在基于IBM Power的服務器上,Spyre客戶可以利用一系列AI服務,為企業工作流程實現端到端的AI。客戶只需點擊一下即可從目錄中安裝AI服務。Spyre Accelerator for Power與片上加速器(MMA)相結合,還可以加速生成AI的數據轉換,為深度過程集成提供高吞吐量。此外,它的提示大小為128,可以在一小時內接收800多萬份文檔進行知識庫集成。這種性能與IBM軟件棧、安全性、可擴展性和能效相結合,支持客戶將生成式人工智能框架集成到企業工作負載中。
與 Ai 時代前沿合作,將大門向更多普通用戶敞開!無論你是對新技術充滿好奇心的愛好者,還是希望提升自己技能的職場人士,這里都有適合你的課程和資源。歡迎掃碼加入我們!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.