<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      微軟Maia 200掰TPUv7手腕,AI推理加速進(jìn)入定制時代

      0
      分享至

      微軟終于發(fā)布了第二代定制AI芯片Maia 200。這距離它上一代AI芯片已經(jīng)過去了兩年多,迭代節(jié)奏既慢于英偉達(dá)不斷加速的產(chǎn)品周期,也落后于谷歌TPU的代際推進(jìn)。但它已經(jīng)能夠讓微軟站穩(wěn),參與這場大規(guī)模云廠商之間的“軍備競賽”。作為后來者,它更直接地圍繞當(dāng)前推理負(fù)載的真實約束展開。

      AI已經(jīng)進(jìn)入推理時代,不同應(yīng)用場景需要針對不同約束條件優(yōu)化。這正是過去一年英偉達(dá) GPU 敘事出現(xiàn)松動的底層原因。但到了2026年,競爭的重心進(jìn)一步下沉至超大規(guī)模云廠商定制 AI 芯片之間的正面較量。誰能在給定成本、延遲和能耗水平下,提供更高的實際性能,誰才有望贏得這場競爭。

      去年,TPU最先改變了AI競爭。谷歌Gemini 3與第七代TPU Ironwood的組合,開始對主要基于英偉達(dá)GPU的OpenAI,形成了總擁有成本上的長期競爭優(yōu)勢。到年底,亞馬遜第三代Trainium發(fā)布,讓Anthropic有底氣不斷推出更強(qiáng)大的智能體應(yīng)用。在這場競賽中,無論是微軟還是OpenAI,盡管關(guān)系日益微妙,但仍然誰都離不開誰。

      2025/12/1 完整閱讀 >

      在官方博客中,微軟將Maia 200描述為“目前所有超大規(guī)模數(shù)據(jù)中心中性能最高的自研芯片”。按照微軟給出的測算,如果以Maia 200替換其現(xiàn)有AI推理基礎(chǔ)設(shè)施,那么在相同投入下,每1美元可獲得約30%的額外性能,相當(dāng)于將OpenAI最新GPT-5.2模型的單位推理成本降低近25%。

      具體而言,Maia 200采用臺積電3nm工藝制造,擁有超過1400億顆晶體管。每塊芯片在FP4精度下,可實現(xiàn)超過10 PFLOPS的算力,是亞馬遜Trainium 3的近4倍,F(xiàn)P8性能超越了谷歌第七代TPU。它搭載了216GB的HBM3e,內(nèi)存帶寬7 TB/s,縱向擴(kuò)展帶寬高達(dá)2.8 TB/s。

      事實上,如果僅從紙面指標(biāo)來看,Maia 200的多項性能參數(shù),已經(jīng)不在英偉達(dá)的B200之下,甚至在部分精度推理場景下,可以與最新的B300相提并論。當(dāng)然,下半年英偉達(dá)Vera Rubin架構(gòu)的GPU,將再次抬高這場競賽的準(zhǔn)入門檻。

      不過,在超大規(guī)模系統(tǒng)擴(kuò)展能力上,微軟仍然有所取舍。Maia 200支持最多6,144顆AI芯片縱向互聯(lián),規(guī)模略低于谷歌Ironwood所能支持的9,216顆芯片,超節(jié)點層面的峰值算力也因此稍遜一籌。


      在大規(guī)模推理時代,能效正在上升為另一個決定性競爭要素。如果說,每一美元可獲得的算力決定了“token工廠”的資本開支,那么,每一瓦所能輸出的性能則直接影響其長期運營成本。在微軟披露的典型推理工況下,Maia 200在750W的TDP(熱設(shè)計功耗)約束內(nèi),仍能釋放出極高的有效算力,其單位功耗性能明顯優(yōu)于谷歌、亞馬遜與英偉達(dá)當(dāng)前一代的AI芯片。

      為了以更低的成本持續(xù)生成token,微軟在Maia 200上做出了一系列高度指向性的架構(gòu)取舍。它或部分代表了未來定制AI芯片的趨勢。

      其中最核心的一點,是它從底層開始就為低精度執(zhí)行而原生設(shè)計。通過降低數(shù)值精度,不僅可以顯著提升推理吞吐、壓縮內(nèi)存占用,還能同步改善每瓦性能。相比之下,谷歌第七代 TPU 并未公開其在FP4精度下的算力表現(xiàn),而亞馬遜第三代Trainium在FP4下的算力,也并未相較FP8出現(xiàn)提升。

      盡管市場普遍認(rèn)為,谷歌第七代TPU在單位成本算力上已對英偉達(dá)Blackwell架構(gòu)形成壓力,但這種優(yōu)勢并非在所有推理階段都同樣成立。有分析顯示,在Prefill階段,英偉達(dá)憑借對FP4精度的支持,使GB200/GB300相較TPU v7 External仍保有約35%–50%的成本優(yōu)勢;而在Decode階段,雙方的實際性價比差距也沒有那樣懸殊。

      這也從側(cè)面解釋了英偉達(dá)近幾代架構(gòu)的演進(jìn)邏輯。Blackwell為超低精度推理系統(tǒng)性地鋪平了道路,原生支持FP4、MXFP4與NVFP4等多種4位浮點格式,為模型在更低精度下運行預(yù)留了充分空間。在此基礎(chǔ)上,相較GB200,GB300的主要性能增量幾乎全部集中在FP4吞吐率與低精度執(zhí)行效率上;而隨后的Vera Rubin架構(gòu),則繼續(xù)放大FP4在整體算力結(jié)構(gòu)中的權(quán)重。

      但在推理場景中,決定系統(tǒng)上限的,往往并不只是算力本身,而是數(shù)據(jù)如何被存儲、如何被訪問,以及能夠被多近地反復(fù)使用。正如“HBM 之父”金正浩(Jung Ho Kim)所形容的那樣,AI系統(tǒng)更像是一塊奶油蛋糕,真正決定品質(zhì)與價值的,是內(nèi)存這層“奶油”。

      正是在這樣的背景下,Maia 200的設(shè)計開始圍繞大體量片上SRAM做文章。微軟并沒有繼續(xù)單純押注更高帶寬的HBM,而是重新設(shè)計了內(nèi)存層次結(jié)構(gòu),將大量存儲能力前移到計算單元附近。Maia 200搭載了272 MB的片上SRAM,不僅高于亞馬遜Trainium 3的256 MB,也超過了以速度著稱的Groq LPU的230 MB。

      這種思路并不陌生。如果HBM代表著“更大的帶寬”,那么通過SRAM層面的創(chuàng)新,實現(xiàn)“更近的距離”。某種意義上,這也是英偉達(dá)近年來重新審視推理架構(gòu)的重要線索。去年底,黃仁勛砸了200億美元,把Groq的核心團(tuán)隊收編回家。

      2025/12/25 完整閱讀 >

      片上SRAM之于Maia 200的意義,并不只在于容量本身,更在于它重新定義了數(shù)據(jù)在推理芯片中的流動方式。與依賴硬件緩存自動調(diào)度不同,Maia 200將片上SRAM劃分為Tile級與Cluster級兩個層次,并交由軟件進(jìn)行顯式管理。這意味著,哪些數(shù)據(jù)該被固定在計算單元附近、哪些數(shù)據(jù)需要在不同計算階段之間流轉(zhuǎn),成為可被精確規(guī)劃的數(shù)據(jù)路徑選擇。大量原本必須往返HBM的數(shù)據(jù),駐留在片上,降低了對更高延遲內(nèi)存層級的依賴。這使得即便在模型結(jié)構(gòu)愈發(fā)復(fù)雜、序列長度不斷拉長的情況下,計算單元仍能維持較高的利用率和穩(wěn)定的吞吐表現(xiàn),也降低了能耗。

      圍繞這一重新設(shè)計的內(nèi)存層次結(jié)構(gòu),Maia 200構(gòu)建了一套高度面向推理的數(shù)據(jù)流架構(gòu)。與之配合的,是分層設(shè)計的專用DMA(Direct Memory Access)引擎。其中,Tile級DMA負(fù)責(zé)計算單元與本地SRAM之間的細(xì)粒度搬運,Cluster級DMA調(diào)度片上不同計算單元與HBM之間的數(shù)據(jù)流動。更關(guān)鍵的是,這套DMA體系并非被動響應(yīng)計算請求,而是通過提前調(diào)度與傳輸重疊,將數(shù)據(jù)在計算單元真正需要之前送達(dá),從而最大限度地減少空轉(zhuǎn)。

      對于微軟而言,Maia 200并非單純的硬件升級路徑。去年底,微軟CEO薩蒂亞·納德拉(Satya Nadella)在一次訪談中,提及微軟的計劃是在自己的MAI模型和芯片之間建立協(xié)同設(shè)計的閉環(huán)。

      目前,Maia 200已率先部署在微軟位于愛荷華州的數(shù)據(jù)中心,并開始進(jìn)入實際生產(chǎn)環(huán)境。MicrosoftAI的CEO穆斯塔法·蘇萊曼(Mustafa Suleyman)透露,微軟已經(jīng)在使用Maia 200研發(fā)自己的前沿大模型。同時,下一代Maia 300的設(shè)計工作也已啟動。


      在這個意義上,Maia系列并不是為了“對標(biāo)英偉達(dá)”而存在,而是被定位為“一家擁有統(tǒng)一平臺邏輯的公司”中的關(guān)鍵拼圖。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      外媒:一艘懸掛美國國旗油輪遭兩枚炮彈擊中

      外媒:一艘懸掛美國國旗油輪遭兩枚炮彈擊中

      參考消息
      2026-03-02 20:53:04
      新娘全家都是演員!這場“完美婚禮”全是戲!

      新娘全家都是演員!這場“完美婚禮”全是戲!

      看看新聞Knews
      2026-03-02 17:55:03
      王石不再裝了!丟棄假發(fā)套反更顯年輕,現(xiàn)身香港聚會仍位居C位!

      王石不再裝了!丟棄假發(fā)套反更顯年輕,現(xiàn)身香港聚會仍位居C位!

      娛樂團(tuán)長
      2026-03-01 20:02:05
      毛主席曾留七大預(yù)言:當(dāng)時沒人信,如今6個已應(yīng)驗,第7個即將實現(xiàn)

      毛主席曾留七大預(yù)言:當(dāng)時沒人信,如今6個已應(yīng)驗,第7個即將實現(xiàn)

      秀心文雅
      2025-09-13 10:25:44
      心酸!女子年后回娘家被趕出門后續(xù): 原因曝光令人憤怒,評論淪陷

      心酸!女子年后回娘家被趕出門后續(xù): 原因曝光令人憤怒,評論淪陷

      離離言幾許
      2026-03-02 17:19:50
      中國50后還有多少人?多少人能活到80歲?權(quán)威數(shù)據(jù)告訴你

      中國50后還有多少人?多少人能活到80歲?權(quán)威數(shù)據(jù)告訴你

      深度報
      2026-02-27 21:36:50
      外媒:美官員首次證實美海軍陸戰(zhàn)隊士兵在美駐巴基斯坦領(lǐng)事館外的抗議活動中開火

      外媒:美官員首次證實美海軍陸戰(zhàn)隊士兵在美駐巴基斯坦領(lǐng)事館外的抗議活動中開火

      環(huán)球網(wǎng)資訊
      2026-03-03 12:01:22
      伊朗稱霍爾木茲海峽已關(guān)閉 將打擊所有試圖通過的船只

      伊朗稱霍爾木茲海峽已關(guān)閉 將打擊所有試圖通過的船只

      財聯(lián)社
      2026-03-03 04:20:36
      伊朗導(dǎo)彈炸翻比亞迪,史上最硬核廣告爆了

      伊朗導(dǎo)彈炸翻比亞迪,史上最硬核廣告爆了

      營銷頭版
      2026-03-03 11:42:23
      新華時評:當(dāng)炸彈落在校園,文明底線何在

      新華時評:當(dāng)炸彈落在校園,文明底線何在

      澎湃新聞
      2026-03-01 22:32:48
      孫穎莎奪冠發(fā)聲!用兩個稱呼去喊王曼昱,卻和王楚欽互相不曬合影

      孫穎莎奪冠發(fā)聲!用兩個稱呼去喊王曼昱,卻和王楚欽互相不曬合影

      三十年萊斯特城球迷
      2026-03-02 23:01:58
      霍梅尼去世前,為何不選擇兒子接班,而是把伊朗交給哈梅內(nèi)伊?

      霍梅尼去世前,為何不選擇兒子接班,而是把伊朗交給哈梅內(nèi)伊?

      擔(dān)撲
      2026-03-02 22:35:09
      不再執(zhí)教廣東男籃?杜鋒發(fā)聲,正式任命,新職務(wù)曝光,朱芳雨祝福

      不再執(zhí)教廣東男籃?杜鋒發(fā)聲,正式任命,新職務(wù)曝光,朱芳雨祝福

      萌蘭聊個球
      2026-03-03 11:16:15
      伯納烏8萬人暴怒!高呼78歲老佛爺下課+后者臉色鐵青 僅1球員謝場

      伯納烏8萬人暴怒!高呼78歲老佛爺下課+后者臉色鐵青 僅1球員謝場

      風(fēng)過鄉(xiāng)
      2026-03-03 06:36:57
      為何歷史課本只教我們茍且一隅的南宋,卻不提威震中亞的西遼?

      為何歷史課本只教我們茍且一隅的南宋,卻不提威震中亞的西遼?

      掠影后有感
      2026-03-03 10:50:35
      特朗普妻子安理會上遭怒斥:你丈夫下令轟炸小學(xué)

      特朗普妻子安理會上遭怒斥:你丈夫下令轟炸小學(xué)

      大風(fēng)新聞
      2026-03-03 11:24:13
      92歲臺灣老兵回重慶尋親,下飛機(jī)后卻怒斥子女:這不還是臺北

      92歲臺灣老兵回重慶尋親,下飛機(jī)后卻怒斥子女:這不還是臺北

      海佑講史
      2026-02-28 21:19:37
      “大力神”軍機(jī)墜毀 已致15人死亡 天空下鈔票雨 民眾瘋搶!

      “大力神”軍機(jī)墜毀 已致15人死亡 天空下鈔票雨 民眾瘋搶!

      每日經(jīng)濟(jì)新聞
      2026-02-28 14:37:58
      特朗普想在伊朗復(fù)制委內(nèi)瑞拉模式,其顧問直言:幾乎沒有可能

      特朗普想在伊朗復(fù)制委內(nèi)瑞拉模式,其顧問直言:幾乎沒有可能

      極目新聞
      2026-03-03 10:49:39
      為什么中國專家永遠(yuǎn)誤判美國的戰(zhàn)爭行為

      為什么中國專家永遠(yuǎn)誤判美國的戰(zhàn)爭行為

      凱利經(jīng)濟(jì)觀察
      2026-03-02 13:32:11
      2026-03-03 14:27:00
      未盡研究 incentive-icons
      未盡研究
      新能源、人工智能、合成生物、地緣X
      319文章數(shù) 62關(guān)注度
      往期回顧 全部

      科技要聞

      手機(jī)AI在MWC上卷出了新高度

      頭條要聞

      伊朗稱摧毀美空軍基地大樓:20架無人機(jī)和3枚導(dǎo)彈命中

      頭條要聞

      伊朗稱摧毀美空軍基地大樓:20架無人機(jī)和3枚導(dǎo)彈命中

      體育要聞

      35輪后積分-7,他們遭遇史上最早的降級

      娛樂要聞

      謝娜霸氣護(hù)夫:喊話薛之謙給張杰道歉

      財經(jīng)要聞

      霍爾木茲海峽近乎停擺 布油直逼80美元

      汽車要聞

      長安汽車2月銷量151922輛 環(huán)比逆勢增長12.8%

      態(tài)度原創(chuàng)

      本地
      藝術(shù)
      數(shù)碼
      房產(chǎn)
      游戲

      本地新聞

      食味印象|一口入魂!康樂烤肉串起千年絲路香

      藝術(shù)要聞

      Nihad Aghazada:當(dāng)代阿塞拜疆畫家

      數(shù)碼要聞

      NVIDIA新驅(qū)動解決風(fēng)扇停轉(zhuǎn)問題:但悄悄限制RTX 50 GPU電壓!

      房產(chǎn)要聞

      方案突然曝光!海口北師大附校,又有書包大盤殺出!

      卡普空現(xiàn)已移除《生化危機(jī)4:重制版》新加密保護(hù)

      無障礙瀏覽 進(jìn)入關(guān)懷版