<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      微軟甩出3nm自研AI芯片!算力超10PFLOPS,干翻AWS谷歌

      0
      分享至


      芯東西(公眾號:aichip001)
      作者 ZeR0
      編輯 漠影

      芯東西1月27日報道,今日,微軟宣布推出自研AI推理芯片Maia 200,并稱該芯片是“目前所有超大規(guī)模數(shù)據(jù)中心中性能最高的自研芯片”,旨在顯著提升AI token生成的經(jīng)濟(jì)效益。

      Maia 200采用臺積電3nm工藝制造,擁有超過1400億顆晶體管,配備原生FP8/FP4張量核心,重新設(shè)計(jì)的內(nèi)存子系統(tǒng)包含216GB HBM3e(讀寫速度高達(dá)7TB/s)和272MB片上SRAM,以及能確保海量模型快速高效運(yùn)行的數(shù)據(jù)傳輸引擎。

      Maia 200專為使用低精度計(jì)算的最新模型而設(shè)計(jì),每塊芯片在FP4精度下可提供超過10PFLOPS的性能,在FP8精度下可提供超過5PFLOPS的性能,所有這些都控制在750W的SoC TDP范圍內(nèi)。

      其FP4性能是亞馬遜自研AI芯片AWS Trainium3的3倍多,F(xiàn)P8性能超過了谷歌TPU v7。


      ▲Azure Maia 200、AWS Trainium3、谷歌TPU v7的峰值規(guī)格對比

      Maia 200重新設(shè)計(jì)的內(nèi)存子系統(tǒng)以窄精度數(shù)據(jù)類型、專用DMA引擎、片上SRAM和用于高帶寬數(shù)據(jù)傳輸?shù)膶S闷暇W(wǎng)絡(luò)(NoC)架構(gòu)為核心,從而提高token吞吐量。

      互連方面,Maia 200提供2.8TB/s雙向?qū)S脭U(kuò)展帶寬,高于AWS Trainium3的2.56TB/s和谷歌TPU v7的1.2TB/s。

      Maia 200也是微軟迄今為止部署的最高效推理系統(tǒng),每美元性能比微軟目前部署的最新一代硬件提升了30%。

      一、能運(yùn)行當(dāng)前最大模型,將支持GPT-5.2

      根據(jù)微軟博客文章,Maia 200可輕松運(yùn)行當(dāng)今最大的模型,并為未來更大的模型預(yù)留了充足的性能空間。

      作為微軟異構(gòu)AI基礎(chǔ)設(shè)施的一部分,Maia 200將支持多種模型,包括OpenAI最新的GPT-5.2模型,從而為Microsoft Foundry和Microsoft 365 Copilot帶來更高的性價比。


      ▲Maia 200芯片

      Maia 200與微軟Azure無縫集成。微軟正在預(yù)覽Maia軟件開發(fā)工具包(SDK),其中包含一套完整的工具,用于構(gòu)建和優(yōu)化Maia 200模型。

      它包含全套功能,包括PyTorch集成、Triton編譯器和優(yōu)化的內(nèi)核庫,以及對Maia底層編程語言的訪問。這使開發(fā)者能夠在需要時進(jìn)行細(xì)粒度控制,同時實(shí)現(xiàn)跨異構(gòu)硬件加速器的輕松模型移植。

      微軟超級智能團(tuán)隊(duì)將利用Maia 200進(jìn)行合成數(shù)據(jù)生成強(qiáng)化學(xué)習(xí),以改進(jìn)下一代內(nèi)部模型。

      在合成數(shù)據(jù)管道用例方面,Maia 200的獨(dú)特設(shè)計(jì)有助于加快高質(zhì)量、特定領(lǐng)域數(shù)據(jù)的生成和篩選速度,為下游訓(xùn)練提供更新、更具針對性的信號。

      Maia 200已部署在微軟位于愛荷華州得梅因附近的美國中部數(shù)據(jù)中心區(qū)域,接下來將部署位于亞利桑那州鳳凰城附近的美國西部3數(shù)據(jù)中心區(qū)域,未來還將部署更多區(qū)域。

      二、支持2.8TB/s雙向帶寬、6144塊芯片互連

      在系統(tǒng)層面,Maia 200引入了一種基于標(biāo)準(zhǔn)以太網(wǎng)的新型雙層可擴(kuò)展網(wǎng)絡(luò)設(shè)計(jì)。定制的傳輸層和緊密集成的網(wǎng)卡無需依賴專有架構(gòu),即可實(shí)現(xiàn)卓越的性能、強(qiáng)大的可靠性和顯著的成本優(yōu)勢。

      每塊芯片提供2.8TB/s雙向?qū)S脭U(kuò)展帶寬,以及在多達(dá)6144塊芯片的集群上公開可預(yù)測的高性能集體操作。


      ▲Maia 200刀片服務(wù)器的俯視圖

      每個托架內(nèi),4塊Maia芯片通過直接的非交換鏈路完全連接,實(shí)現(xiàn)高帶寬的本地通信,以獲得最佳推理效率。

      機(jī)架內(nèi)和機(jī)架間聯(lián)網(wǎng)均采用相同的通信協(xié)議,即Maia AI傳輸協(xié)議,能夠以最小的網(wǎng)絡(luò)跳數(shù)實(shí)現(xiàn)跨節(jié)點(diǎn)、機(jī)架和加速器集群的無縫擴(kuò)展。

      這種統(tǒng)一的架構(gòu)簡化了編程,提高了工作負(fù)載的靈活性,并減少了閑置容量,同時在云規(guī)模下保持了一致的性能和成本效益。

      該架構(gòu)可為密集推理集群提供可擴(kuò)展的性能,同時降低Azure全球集群的功耗和總擁有成本。

      三、將芯片部署時間縮短一半,提升每美元和每瓦性能

      Maia 200芯片首批封裝件到貨后數(shù)日內(nèi),AI模型就能在其上運(yùn)行,從首批芯片到首個數(shù)據(jù)中心機(jī)架部署的時間可縮短至同類AI基礎(chǔ)設(shè)施項(xiàng)目的一半以上

      這種從芯片到軟件再到數(shù)據(jù)中心的端到端解決方案,直接轉(zhuǎn)化為更高的資源利用率、更快的生產(chǎn)交付速度,以及在云規(guī)模下持續(xù)提升的每美元和每瓦性能。


      ▲Maia 200機(jī)架和HXU冷卻單元的視圖

      這歸因于,微軟芯片開發(fā)計(jì)劃的核心原則是在最終芯片上市之前,盡可能多地驗(yàn)證端到端系統(tǒng)。

      從架構(gòu)的早期階段開始,一套精密的芯片前開發(fā)環(huán)境就指導(dǎo)著Maia 200的開發(fā),它能夠高保真地模擬大語言模型的計(jì)算和通信模式。

      這種早期協(xié)同開發(fā)環(huán)境使微軟能夠在首塊芯片問世之前,將芯片、網(wǎng)絡(luò)和系統(tǒng)軟件作為一個整體進(jìn)行優(yōu)化。

      微軟從設(shè)計(jì)之初就將Maia 200定位為數(shù)據(jù)中心內(nèi)快速、無縫的可用性解決方案,并對包括后端網(wǎng)絡(luò)和第二代閉環(huán)液冷熱交換器單元在內(nèi)的一些最復(fù)雜的系統(tǒng)組件進(jìn)行了早期驗(yàn)證。

      與Azure控制平面的原生集成,可在芯片和機(jī)架級別提供安全、遙測、診斷和管理功能,從而最大限度地提高生產(chǎn)關(guān)鍵型AI工作負(fù)載的可靠性和正常運(yùn)行時間。

      結(jié)語:在全球基礎(chǔ)設(shè)施部署,為未來幾代AI系統(tǒng)托舉

      大規(guī)模AI時代才剛剛開始,基礎(chǔ)設(shè)施將決定其發(fā)展的可能性。

      隨著微軟在全球基礎(chǔ)設(shè)施中部署Maia 200,微軟已在為未來幾代AI系統(tǒng)進(jìn)行設(shè)計(jì),并期望每一代系統(tǒng)都能不斷樹立新的標(biāo)桿,為重要的AI工作負(fù)載帶來更出色的性能和效率。

      微軟誠邀開發(fā)者、AI創(chuàng)企和學(xué)術(shù)界人士使用全新Maia 200 SDK開始探索早期模型和工作負(fù)載優(yōu)化。

      該SDK包含Triton編譯器、PyTorch支持、NPL底層編程以及Maia模擬器和成本計(jì)算器,可在代碼生命周期的早期階段優(yōu)化效率。


      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      驚艷!劉亦菲這張照片,被稱最接近本人的一張圖!

      驚艷!劉亦菲這張照片,被稱最接近本人的一張圖!

      隨性的海浪
      2026-02-26 18:19:37
      搞民族歧視的,除了看守所,還有殯葬業(yè)!

      搞民族歧視的,除了看守所,還有殯葬業(yè)!

      疫苗與科學(xué)
      2026-02-27 07:42:27
      希拉里向國會作證 稱對愛潑斯坦案“不知情”

      希拉里向國會作證 稱對愛潑斯坦案“不知情”

      新華社
      2026-02-27 09:30:05
      一級軍士長的地位有多高?相當(dāng)于什么級別?為何師長見了都得敬禮

      一級軍士長的地位有多高?相當(dāng)于什么級別?為何師長見了都得敬禮

      觀銳器
      2026-02-26 22:20:40
      董璇大年初九回婆家,一家21口合照,張維伊外婆感動的熱淚盈眶

      董璇大年初九回婆家,一家21口合照,張維伊外婆感動的熱淚盈眶

      觀察鑒娛
      2026-02-27 09:30:13
      先奔印度再來北京?專家直言:默茨犯下大錯,德國已錯失窗口

      先奔印度再來北京?專家直言:默茨犯下大錯,德國已錯失窗口

      牛鍋巴小釩
      2026-02-27 08:57:44
      隨著中國男籃掀翻日本,韓國遭首敗,世預(yù)賽最新形勢:亂成一鍋粥

      隨著中國男籃掀翻日本,韓國遭首敗,世預(yù)賽最新形勢:亂成一鍋粥

      侃球熊弟
      2026-02-26 21:05:46
      他是上海足球名宿,豪取4個中超冠軍,36歲退役,如今接班徐根寶

      他是上海足球名宿,豪取4個中超冠軍,36歲退役,如今接班徐根寶

      寒士之言本尊
      2026-02-25 19:08:24
      美菲軍演突發(fā)意外

      美菲軍演突發(fā)意外

      陸棄
      2026-02-26 08:30:03
      中方高規(guī)格招待,默茨接過鮮花,走進(jìn)人民大會堂前,他喊出9個字

      中方高規(guī)格招待,默茨接過鮮花,走進(jìn)人民大會堂前,他喊出9個字

      福建平子
      2026-02-27 09:16:12
      富士康“賭輸”了!郭臺銘做夢也沒有想到,“制裁”會來的這么快

      富士康“賭輸”了!郭臺銘做夢也沒有想到,“制裁”會來的這么快

      混沌錄
      2025-08-22 18:23:58
      1980年鄧小平說:毛主席的錯誤,要毫不含糊地批評,但要實(shí)事求是

      1980年鄧小平說:毛主席的錯誤,要毫不含糊地批評,但要實(shí)事求是

      帝哥說史
      2026-02-25 06:30:03
      只有一張光盤,容量卻仿佛裝下了整個中世紀(jì),它當(dāng)年的逼格甚至蓋過了最終幻想

      只有一張光盤,容量卻仿佛裝下了整個中世紀(jì),它當(dāng)年的逼格甚至蓋過了最終幻想

      小怪吃美食
      2026-02-27 01:43:34
      WTT新加坡大滿貫:2月27賽程公布!國乒再戰(zhàn)早田、橋本、雨果

      WTT新加坡大滿貫:2月27賽程公布!國乒再戰(zhàn)早田、橋本、雨果

      全言作品
      2026-02-27 06:40:03
      美荷兩國曾同時發(fā)聲,對中國獨(dú)立研發(fā)的光刻機(jī)技術(shù)給予了強(qiáng)烈批評

      美荷兩國曾同時發(fā)聲,對中國獨(dú)立研發(fā)的光刻機(jī)技術(shù)給予了強(qiáng)烈批評

      來科點(diǎn)譜
      2026-02-27 07:32:59
      南大學(xué)霸夫妻在蘇州創(chuàng)業(yè),拿下近億元B+輪融資

      南大學(xué)霸夫妻在蘇州創(chuàng)業(yè),拿下近億元B+輪融資

      創(chuàng)客公社-江蘇第一創(chuàng)投媒體
      2026-02-26 20:11:16
      個稅年度匯算開始,這些坑你可別跳進(jìn)去

      個稅年度匯算開始,這些坑你可別跳進(jìn)去

      賈話連篇
      2026-02-26 17:55:13
      難以置信!一深圳牌邁巴赫登熱搜,車尾箱堆滿土特產(chǎn),掛一籠土雞

      難以置信!一深圳牌邁巴赫登熱搜,車尾箱堆滿土特產(chǎn),掛一籠土雞

      小李子體育
      2026-02-26 02:37:04
      一號文件:農(nóng)村迎來3大調(diào)整,涉及家家戶戶,農(nóng)民朋友要早準(zhǔn)備

      一號文件:農(nóng)村迎來3大調(diào)整,涉及家家戶戶,農(nóng)民朋友要早準(zhǔn)備

      愛下廚的阿椅
      2026-02-27 08:50:40
      江西女子用公驢器官泡酒,三個月后給丈夫喝,不料發(fā)生意外

      江西女子用公驢器官泡酒,三個月后給丈夫喝,不料發(fā)生意外

      古怪奇談錄
      2025-06-28 13:49:02
      2026-02-27 10:16:49
      芯東西 incentive-icons
      芯東西
      專注AI芯片、半導(dǎo)體產(chǎn)業(yè)媒體
      2212文章數(shù) 8150關(guān)注度
      往期回顧 全部

      科技要聞

      英偉達(dá)業(yè)績亮眼仍跌5% 兩大因素成核心隱憂

      頭條要聞

      牛彈琴:中國的兩個鄰國大打出手 傷亡相當(dāng)慘重

      頭條要聞

      牛彈琴:中國的兩個鄰國大打出手 傷亡相當(dāng)慘重

      體育要聞

      從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

      娛樂要聞

      向華強(qiáng)公開表態(tài) 財產(chǎn)留給兒媳婦郭碧婷

      財經(jīng)要聞

      魅族手機(jī),終成棄子?

      汽車要聞

      40歲的吉利,不惑于內(nèi)外

      態(tài)度原創(chuàng)

      教育
      數(shù)碼
      本地
      親子
      公開課

      教育要聞

      語文考試議論文文言文,提分不難,這個方法焦老師親測有效

      數(shù)碼要聞

      華碩發(fā)布NUC 16 for Windows 365迷你主機(jī):0.7升,支持三屏輸出

      本地新聞

      津南好·四時總相宜

      親子要聞

      不知道是真是假,社會百態(tài)與未來觀點(diǎn)

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版