<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      微軟投資AI芯片公司,挑戰(zhàn)英偉達(dá)

      0
      分享至

      公眾號記得加星標(biāo)??,第一時(shí)間看推送不會錯(cuò)過。


      如今世界對人工智能的熱情如此高漲,以至于軟件公司都在投資核能,以滿足我們對生成文本、圖像和視頻的需求。但如果他們根本不需要這樣做呢?如果我們能夠魚與熊掌兼得,既擁有人工智能帶來的便利,又能以更高的效率(提高90%)完成更多工作,同時(shí)大幅降低能源消耗,那該多好?

      這就是微軟支持的芯片初創(chuàng)公司d-Matrix的理念。其核心思想是:制造能夠提供更快、更便宜、更高效的推理的芯片,而這正是人工智能公司在回答用戶AI查詢時(shí)所做的。如果d-Matrix的觀點(diǎn)正確,人工智能的未來可能不再取決于誰訓(xùn)練的模型規(guī)模最大,而取決于誰能以最快、最便宜的方式回答問題。

      “訓(xùn)練關(guān)乎表現(xiàn),推理關(guān)乎效率,”首席執(zhí)行官 Sid Sheth 最近在卡塔爾網(wǎng)絡(luò)峰會上與我交談時(shí)說道。

      這種區(qū)別是d-Matrix(他領(lǐng)導(dǎo)的位于硅谷的初創(chuàng)公司)的基石。訓(xùn)練如今的大型語言模型是一項(xiàng)極其繁重的工作,最好使用英偉達(dá)的高端GPU、谷歌的TPU或其他少數(shù)幾種芯片來完成。但謝思表示,GPU并非運(yùn)行AI模型回答問題的理想選擇。然而,這正是業(yè)界目前使用的技術(shù)……主要是因?yàn)闃I(yè)界只能使用GPU。

      這就像用錘子和釘子打掃房子一樣,因?yàn)榉孔泳褪怯眠@些東西蓋的。

      他說:“問題的關(guān)鍵在于你使用的是訓(xùn)練芯片。然后你說,‘哦,你知道嗎?我要在這些芯片上運(yùn)行推理,對吧?’但這并不是最好的方法?!?/p>

      d-Matrix 的創(chuàng)立基于這樣的信念:推理最終將主導(dǎo)人工智能工作負(fù)載。該公司沒有對訓(xùn)練硬件進(jìn)行改造,而是從零開始構(gòu)建了新的架構(gòu)。Sheth 指出,為推理而設(shè)計(jì)的芯片和為訓(xùn)練而設(shè)計(jì)的芯片之間存在著核心的架構(gòu)差異。訓(xùn)練是一個(gè)計(jì)算問題,但推理不僅僅是一個(gè)計(jì)算問題,他說道。更確切地說,推理是一個(gè)計(jì)算和內(nèi)存問題。

      而且,內(nèi)存部分還會增加延遲。

      在大型語言模型中,初始的“處理”階段通常被稱為預(yù)填充。模型會接收提示信息,構(gòu)建上下文并將相關(guān)參數(shù)加載到內(nèi)存中。之后,它才會開始生成詞元(即“解碼”階段),從而提供用戶想要的答案。這種區(qū)別至關(guān)重要,因?yàn)橥评硇阅懿粌H受限于原始計(jì)算能力,還受限于數(shù)據(jù)在內(nèi)存和處理單元之間移動的速度。如果計(jì)算速度快但內(nèi)存訪問速度慢,詞元處理就會停滯。如果內(nèi)存訪問速度快但計(jì)算速度跟不上,吞吐量就會下降。無論哪種情況,用戶都會感受到延遲。

      “這就好比我問你一個(gè)抽象的問題,”謝思解釋說,“你不會立刻脫口而出,對吧?你會先思考。然后兩三秒鐘后,你可能才會開始說話。說話的過程就是解碼。”

      本質(zhì)上,當(dāng)今的大部分基礎(chǔ)設(shè)施都針對訓(xùn)練工作負(fù)載進(jìn)行了優(yōu)化,這些工作負(fù)載優(yōu)先考慮峰值性能而非平均響應(yīng)速度。然而,在推理過程中,尤其是在使用包含多個(gè)問答的交互式人工智能時(shí),延遲就成為了決定性指標(biāo)。

      “一旦你開始回應(yīng),我希望你以一定的速度回應(yīng),否則我可能不會聽,”他補(bǔ)充道。

      實(shí)際上,這意味著要盡可能縮短從內(nèi)存中檢索模型權(quán)重和激活值并將其輸入到計(jì)算單元所需的時(shí)間,以便處理生成的每個(gè)詞元。傳統(tǒng)的GPU架構(gòu)將計(jì)算和高帶寬內(nèi)存分離為獨(dú)立的子系統(tǒng),這可能會降低內(nèi)存密集型推理工作負(fù)載的效率。

      d-Matrix 的解決方案是在其架構(gòu)中將計(jì)算和內(nèi)存緊密融合。通過將內(nèi)存物理位置更靠近計(jì)算位置,并專門針對推理模式優(yōu)化數(shù)據(jù)流,該公司旨在降低令牌延遲并提高每瓦每秒令牌數(shù)。此外,該公司沒有構(gòu)建單個(gè)龐大的單芯片處理器,而是將硅片切割成更小的模塊化構(gòu)建塊,稱為芯片組 (chiplet)。然后,根據(jù)工作負(fù)載需求,將這些芯片組以不同的數(shù)量組合起來。

      從概念上講,它更接近蘋果的統(tǒng)一內(nèi)存設(shè)計(jì),而不是傳統(tǒng)的 GPU 架構(gòu):減少計(jì)算和內(nèi)存之間的距離,并圍繞效率而不是峰值基準(zhǔn)性能進(jìn)行優(yōu)化。

      d-Matrix并沒有在針對訓(xùn)練優(yōu)化的芯片上進(jìn)行蠻力推理,而是基于推理將占據(jù)主導(dǎo)地位的假設(shè)來設(shè)計(jì)芯片。Sheth聲稱,其結(jié)果是更低的延遲和顯著更高的每瓦浮點(diǎn)運(yùn)算次數(shù),尤其是在實(shí)時(shí)交互式工作負(fù)載方面。

      這意味著成本優(yōu)勢。

      Sheth表示,目前d-Matrix在運(yùn)行推理操作時(shí),成本比GPU降低了約90%。而且未來還有更多優(yōu)勢。

      “這就是今天的情況,”他說。“以后只會越來越好?!?/p>

      或許來得正是時(shí)候,甚至可能有點(diǎn)晚。OpenAI現(xiàn)在正使用 Cerebras 的巨型芯片(芯片大?。﹣磉\(yùn)行其 GPT-5.3-Codex-Spark 編碼模型的推理,與其他架構(gòu)相比,速度提升了 15 到 20 倍。Cerebras 的方法與 d-Matrix 完全不同,但目標(biāo)相似。

      d-Matrix今天開始出貨芯片,但數(shù)量很少,只有幾百顆左右。Sheth表示,很快產(chǎn)量就會達(dá)到數(shù)千顆。他很快就需要達(dá)到數(shù)百萬顆的產(chǎn)量,并有望在今年實(shí)現(xiàn)。

      “今年你就會看到它大規(guī)模量產(chǎn)了,”他告訴我。

      都想把英偉達(dá)拉下馬

      目前 ,英偉達(dá) 是AI芯片行業(yè)無可爭議的冠軍,其圖形處理單元主導(dǎo)著人工智能模型的訓(xùn)練和運(yùn)行市場——公司市值達(dá)到4.5萬億美元。

      但創(chuàng)始人和投資者對替代方案的興趣越來越大。客戶會跟隨嗎?其中一些已經(jīng)存在,盡管以實(shí)驗(yàn)形式存在,是對抗英偉達(dá)主導(dǎo)地位的對沖,或者僅僅是在這個(gè)異常緊張的市場中獲得更多芯片的途徑。

      交易公司Jump的首席技術(shù)官Alex Davies表示:“幾乎所有人都在Nvidia上做一些事情——無論是訓(xùn)練還是推理——我們看到行業(yè)正在變化,而這還不是常態(tài),Jump 本月向AI芯片初創(chuàng)公司Positron 進(jìn)行了2.3億美元的融資,同時(shí)也是Positron的客戶?!拔覀儾徽J(rèn)為會有一個(gè)贏家。”

      尤其是,初創(chuàng)企業(yè)和投資者看到了推理領(lǐng)域中的一個(gè)空缺,即在AI模型訓(xùn)練完成后運(yùn)行它們——比如讓ChatGPT給出答案。英偉達(dá)首席執(zhí)行官黃仁勛本人也證實(shí)了其他公司可能在該領(lǐng)域有所貢獻(xiàn)的可能性,比如圣誕老人在圣誕夜(請考慮一下我們這些已經(jīng)在度假的人),據(jù)報(bào)道將獲得200億美元的賠償金,用于授權(quán)推理硬件初創(chuàng)公司Groq的技術(shù),并聘用該公司大部分芯片團(tuán)隊(duì)成員, 其中包括首席執(zhí)行官喬納森·羅斯。

      Groq收購案;Cerebras簽署的100億美元為OpenAI提供快速推理芯片的交易;以及Anthropic簽署多款非英偉達(dá)芯片協(xié)議的舉措,被視為更多半導(dǎo)體制造商市場機(jī)遇的例子。自Groq交易以來,多家初創(chuàng)公司表示,潛在投資者的興趣不斷上升,而老競爭對手SambaNova則結(jié)束了談判,以遠(yuǎn)低于上輪融資的估值出售,轉(zhuǎn)而注入新的資金。

      “圍繞我們的討論已經(jīng)發(fā)生了變化,”SambaNova首席執(zhí)行官在彭博社看到的一封寫給員工的郵件中表示。

      英偉達(dá)憑借其高帶寬內(nèi)存芯片,是企業(yè)提供大量數(shù)學(xué)計(jì)算所需電力的王者,這些計(jì)算將大量數(shù)據(jù)轉(zhuǎn)化為訓(xùn)練好的AI模型。但一些芯片初創(chuàng)公司正在尋求不同類型的內(nèi)存,以更快地回答用戶在推理過程中提出的逐一問題。此外,訓(xùn)練和推理的類別變得越來越模糊,因?yàn)橥评硇虯I模型在被查詢時(shí)會做出進(jìn)一步判斷,而非主要提前訓(xùn)練。

      自從去年初中國開源推理模型DeepSeek亮相后,人們對這類快速推理芯片的興趣上升,人工智能芯片制造商D-Matrix的首席執(zhí)行官兼創(chuàng)始人Sid Sheth表示,D-Matrix是一家Microsoft支持的初創(chuàng)公司, 去年11月籌集了2.75億美元 。推理模型全年不斷進(jìn)步,促使公司開發(fā)更強(qiáng)大的人工智能應(yīng)用,需要更快的推理。

      謝斯說:“現(xiàn)在模型在回應(yīng)前會思考不同的可能性,你希望加快思考過程?!薄八伎嫉迷娇?,響應(yīng)越快,應(yīng)用的互動性就越強(qiáng)?!?/p>

      周四,OpenAI 發(fā)布了首個(gè)運(yùn)行在Cerebras芯片上的模型。Anthropic 與 亞馬遜的 Trainium 和谷歌的張量處理單元芯片達(dá)成協(xié)議。Microsoft上個(gè)月發(fā)布了其第二代AI芯片Maia,如果想用它開發(fā)產(chǎn)品,可以使用OpenAI的芯片知識產(chǎn)權(quán)。人工智能芯片初創(chuàng)公司Etched 上個(gè)月在一輪融資中籌集了約5億美元 ,以助力其與英偉達(dá)競爭的雄心。

      話雖如此,英偉達(dá)已經(jīng)證明并很可能繼續(xù)成為一個(gè)異常強(qiáng)大的市場領(lǐng)導(dǎo)者。公司擁有多種產(chǎn)品線,并承諾每年推出一次芯片的全面重新設(shè)計(jì)。與Groq的合作為英偉達(dá)提供了進(jìn)一步擴(kuò)展的機(jī)會。 上個(gè)月被問 及該協(xié)議是否會導(dǎo)致新的專用推理芯片,黃明明未作任何承諾,表示“也許有一個(gè)地方,我們可以創(chuàng)造出獨(dú)特的東西?!?/p>

      但Sheth預(yù)計(jì)Nvidia將在三月旗艦大會上宣布對快速推理芯片需求的回應(yīng)。

      在不同時(shí)間點(diǎn),初創(chuàng)公司和成熟公司聲稱他們能與英偉達(dá)競爭,但大多數(shù)情況下他們做不到、不能、也沒有。至少不是大規(guī)模或全面性的。這也是為什么即使是開發(fā)自家硅片的大公司——亞馬遜、谷歌、Microsoft、OpenAI——仍然大量使用英偉達(dá)GPU來支撐其AI產(chǎn)品和云服務(wù)。

      然而,我們開始看到裂痕。還有誰能,或者是否有人能把這些資金拉開到足夠大的市場,為自己的芯片創(chuàng)造一個(gè)龐大的市場,還有待觀察。

      “如果你看行業(yè)的增長速度,你會看到專用硬件,”Jump的戴維斯說?!斑@在工程史上一直如此。你一開始是個(gè)普通的東西,然后它瘋狂增長,最后有人發(fā)現(xiàn)你根本不能有一樣?xùn)|西?!?/p>

      (來源:半導(dǎo)體行業(yè)觀察綜合)

      *免責(zé)聲明:本文由作者原創(chuàng)。文章內(nèi)容系作者個(gè)人觀點(diǎn),半導(dǎo)體行業(yè)觀察轉(zhuǎn)載僅為了傳達(dá)一種不同的觀點(diǎn),不代表半導(dǎo)體行業(yè)觀察對該觀點(diǎn)贊同或支持,如果有任何異議,歡迎聯(lián)系半導(dǎo)體行業(yè)觀察。

      今天是《半導(dǎo)體行業(yè)觀察》為您分享的第4318期內(nèi)容,歡迎關(guān)注。

      加星標(biāo)??第一時(shí)間看推送

      求推薦

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      比光纖還猛!MLCC進(jìn)入全面漲價(jià) 這十大產(chǎn)業(yè)龍頭坐享業(yè)績與股價(jià)齊升

      比光纖還猛!MLCC進(jìn)入全面漲價(jià) 這十大產(chǎn)業(yè)龍頭坐享業(yè)績與股價(jià)齊升

      說故事的阿襲
      2026-02-25 08:19:32
      張藝興發(fā)素顏照,年夜飯沒濾鏡,網(wǎng)友說這才是真過年

      張藝興發(fā)素顏照,年夜飯沒濾鏡,網(wǎng)友說這才是真過年

      甜菊汽水
      2026-02-25 11:50:21
      72萬個(gè)充電樁,年入40億,常州夫婦邊賺錢邊收割,如今要上市了

      72萬個(gè)充電樁,年入40億,常州夫婦邊賺錢邊收割,如今要上市了

      毒sir財(cái)經(jīng)
      2026-02-22 10:38:14
      鞏固東部第二!綠軍逆轉(zhuǎn)大勝太陽 懷特22+8+8格林18中5

      鞏固東部第二!綠軍逆轉(zhuǎn)大勝太陽 懷特22+8+8格林18中5

      醉臥浮生
      2026-02-25 12:11:18
      蘋果供應(yīng)鏈要變天?Mac mini今年將在美國工廠組裝,每周產(chǎn)量達(dá)數(shù)千臺【附中國智能手機(jī)產(chǎn)業(yè)鏈分析】

      蘋果供應(yīng)鏈要變天?Mac mini今年將在美國工廠組裝,每周產(chǎn)量達(dá)數(shù)千臺【附中國智能手機(jī)產(chǎn)業(yè)鏈分析】

      前瞻網(wǎng)
      2026-02-25 14:25:30
      消失的 29 斤羊肉去哪了?暗訪揭開烤全羊行業(yè)黑幕

      消失的 29 斤羊肉去哪了?暗訪揭開烤全羊行業(yè)黑幕

      復(fù)轉(zhuǎn)小能手
      2026-02-24 17:32:12
      現(xiàn)在,只是時(shí)間問題了

      現(xiàn)在,只是時(shí)間問題了

      牛彈琴
      2026-02-25 07:57:00
      廣東男籃簽了誰?朱芳雨:大外援已經(jīng)在路上了

      廣東男籃簽了誰?朱芳雨:大外援已經(jīng)在路上了

      狼叔評論
      2026-02-25 12:22:06
      致命陷阱!俄軍批量接收光纖地雷線圈 操作即爆炸已致人員傷亡

      致命陷阱!俄軍批量接收光纖地雷線圈 操作即爆炸已致人員傷亡

      老馬拉車莫少裝
      2026-02-25 08:51:14
      銷冠的我年終獎僅5.9萬,躺平同事卻拿81萬!從此半年0業(yè)績

      銷冠的我年終獎僅5.9萬,躺平同事卻拿81萬!從此半年0業(yè)績

      時(shí)尚的弄潮
      2026-02-25 11:35:46
      閆軍被撤銷國際裁判并非意味著天亮了,在CBA,他依然呼風(fēng)喚雨

      閆軍被撤銷國際裁判并非意味著天亮了,在CBA,他依然呼風(fēng)喚雨

      姜大叔侃球
      2026-02-24 18:12:32
      特朗普白忙活一場,下一任總統(tǒng)熱門候選人出爐,對中國態(tài)度不一般

      特朗普白忙活一場,下一任總統(tǒng)熱門候選人出爐,對中國態(tài)度不一般

      墨蘭史書
      2026-02-24 23:24:46
      旅客稱檢票進(jìn)站后列車已開走 車站已道歉并報(bào)銷相關(guān)費(fèi)用

      旅客稱檢票進(jìn)站后列車已開走 車站已道歉并報(bào)銷相關(guān)費(fèi)用

      閃電新聞
      2026-02-24 14:17:15
      巴拿馬接管長江和記兩座港口,外交部:中方將堅(jiān)決維護(hù)企業(yè)合法權(quán)益

      巴拿馬接管長江和記兩座港口,外交部:中方將堅(jiān)決維護(hù)企業(yè)合法權(quán)益

      澎湃新聞
      2026-02-24 15:30:29
      歐冠2-5大冷門!7億國米恥辱出局:不敵5000萬歐黑馬 齊沃落寞呆坐

      歐冠2-5大冷門!7億國米恥辱出局:不敵5000萬歐黑馬 齊沃落寞呆坐

      風(fēng)過鄉(xiāng)
      2026-02-25 06:21:38
      總想吃是血糖在“求救”,萬曉剛主任教你4招健康飲食

      總想吃是血糖在“求救”,萬曉剛主任教你4招健康飲食

      蠟筆小小子
      2026-02-25 14:25:19
      笑不活了!江西一女子用泡面招待親戚拜年,孩子們稱“明年還來”

      笑不活了!江西一女子用泡面招待親戚拜年,孩子們稱“明年還來”

      火山詩話
      2026-02-25 06:04:42
      小臥室不要再放“雙人床”了,學(xué)年輕人的做法,美觀又實(shí)用!

      小臥室不要再放“雙人床”了,學(xué)年輕人的做法,美觀又實(shí)用!

      室內(nèi)設(shè)計(jì)師有料兒
      2026-02-24 21:03:27
      1980年鄧小平說:毛主席的錯(cuò)誤,要毫不含糊地批評,但要實(shí)事求是

      1980年鄧小平說:毛主席的錯(cuò)誤,要毫不含糊地批評,但要實(shí)事求是

      帝哥說史
      2026-02-25 06:30:03
      解放:馬步芳以為八萬騎兵無敵,彭總近百挺機(jī)槍出擊,時(shí)代變了

      解放:馬步芳以為八萬騎兵無敵,彭總近百挺機(jī)槍出擊,時(shí)代變了

      王嚾曉
      2026-02-23 18:01:59
      2026-02-25 14:59:00
      半導(dǎo)體行業(yè)觀察 incentive-icons
      半導(dǎo)體行業(yè)觀察
      專注觀察全球半導(dǎo)體行業(yè)資訊
      13013文章數(shù) 34810關(guān)注度
      往期回顧 全部

      科技要聞

      “機(jī)器人只跳舞,沒什么用”

      頭條要聞

      15歲少女和姐姐吵架后失聯(lián)半月 父親懸賞100萬尋人

      頭條要聞

      15歲少女和姐姐吵架后失聯(lián)半月 父親懸賞100萬尋人

      體育要聞

      曝雄鹿計(jì)劃今夏追小卡 字母哥渴望與其并肩作戰(zhàn)

      娛樂要聞

      撒貝寧到沈陽跑親戚 老婆李白模特身材

      財(cái)經(jīng)要聞

      春節(jié)檔"開門黑" 電影票少賣了7000萬張

      汽車要聞

      750km超長續(xù)航 2026款小鵬X9純電版將于3月2日上市

      態(tài)度原創(chuàng)

      時(shí)尚
      藝術(shù)
      房產(chǎn)
      家居
      游戲

      普通人穿衣別太老氣橫秋!這些穿搭給你靈感,保暖耐看兩不誤

      藝術(shù)要聞

      這位藝術(shù)家的馬賽克畫讓人驚嘆不已!

      房產(chǎn)要聞

      330萬人涌入!春節(jié)全國樓市,第一個(gè)賣爆的區(qū)域出現(xiàn)了!

      家居要聞

      藝居辦公 溫度與效率

      生化9總監(jiān)是任天堂“死忠粉”?怪物設(shè)計(jì)一脈相承

      無障礙瀏覽 進(jìn)入關(guān)懷版