<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      英偉達封死了ASIC的后路?

      0
      分享至

      公眾號記得加星標??,第一時間看推送不會錯過。

      NVIDIA 計劃憑借下一代 Feynman 芯片主導推理堆棧,因為該公司可以將 LPU 單元集成到架構中。

      乍看之下,NVIDIA 就 Groq 的 LPU 單元達成的 IP 授權協議似乎只是小打小鬧,畢竟收購規模和涉及的營收數額都相當龐大。但實際上,NVIDIA 的目標是通過 LPU 在推理領域占據領先地位,我們此前已對此進行了深入報道。至于 NVIDIA 將如何整合 LPU,目前已有多種方案;

      不過,根據GPU 專家 AGF 的觀點,LPU 單元或許會通過臺積電的混合鍵合技術堆疊在下一代 Feynman GPU 上。

      英偉達要堵死ASIC的道路

      專家認為,該方案的實現方式可能類似于AMD在X3D CPU上的做法,即利用臺積電的SoIC混合鍵合技術將3D V-Cache芯片集成到主計算芯片上。AGF指出,考慮到SRAM的擴展性有限,將SRAM集成到單芯片上可能并非Feynman GPU的正確選擇,因為采用先進工藝節點會浪費高端硅片,并大幅增加每片晶圓的成本。AGF認為,NVIDIA會將LPU單元堆疊到Feynman計算芯片上。


      AGF表示,Groq LPU 模塊將于 2028 年首次出現在 Feynman(Rubin 后世代)。

      確定性、編譯器驅動的數據流,配合靜態低延遲調度和低批處理場景中的高模型浮點利用率(MFU),將在有利工作負載下為費曼帶來巨大的推理性能提升。

      但單片芯片的 SRAM 縮放停滯非常嚴苛:位元單元面積從 N5(~0.021 μm2)到 N3E 幾乎沒有變化,甚至 N2 也只能達到~0.0175 μm2,密度為~38 Mb/mm2。這是一種非常昂貴的晶圓面積使用。

      NVIDIA Feynman 在臺積電 A16 上,配備背面供電+全 GAA 將面臨 SRAM 的門檻和成本物理。

      那么解決方案是什么?

      很簡單,就是制作分離的 SRAM 芯片,并將它們疊放在主計算芯片(也就是 AMD X3D)上。背面電源傳輸簡化了頂部的高密度混合粘結,使 3D 疊加垂直集成 SRAM 更實用,即避免前端布線的噩夢。

      所以預計 Feynman 核心會在 A16 上混合邏輯/計算芯片,實現最大密度/孔徑+堆疊 SRAM,在更便宜/成熟的節點上實現極高封裝帶寬且不會帶來巨大密度損失。

      這保留了 HBM 作為容量(訓練/預填充),而 SRAM 堆棧則修復低延遲解碼 MFU,這正是 Pouladian 的“作弊碼”。

      這似乎讓廠商放棄了所有 ASIC 成功的機會....

      現在看來,這種方案似乎合情合理。方案中,像A16(1.6nm)這樣的芯片將用于主Feynman芯片,其中包含計算模塊(張量單元、控制邏輯等),而獨立的LPU芯片則包含大型SRAM存儲體。此外,為了將這些芯片連接起來,臺積電的混合鍵合技術至關重要,因為它能夠實現寬接口,并且與封裝外存儲器相比,每比特能耗更低。更重要的是,由于A16采用背面供電設計,正面可以用于垂直SRAM連接,從而確保低延遲解碼響應。

      然而,這種技術也存在一些問題,例如NVIDIA將如何應對散熱限制,因為在高計算密度的工藝流程中堆疊芯片本身就是一個挑戰。而且,對于專注于持續吞吐量的LPU來說,這可能會造成瓶頸。更重要的是,這種方法也會極大地增加執行層面的影響,因為LPU依賴于固定的執行順序,這自然會在確定性和靈活性之間造成沖突。

      即使NVIDIA能夠解決硬件層面的限制,主要問題仍然在于CUDA在LPU式執行模式下的行為,因為它需要顯式的內存分配,而CUDA內核的設計初衷是面向硬件抽象。對于NVIDIA來說,將SRAM集成到AI架構中并非易事,因為這需要精湛的工程技術才能確保LPU-GPU環境得到充分優化。然而,如果NVIDIA想要在推理領域保持領先地位,這或許是它愿意付出的代價。

      Groq 的 LPU 架構是關鍵

      過去幾個月,人工智能行業的計算需求發生了翻天覆地的變化。像OpenAI、Meta、Google等公司在致力于訓練前沿模型的同時,也在尋求構建強大的推理堆棧,因為這才是大多數超大規模數據中心的主要盈利點。

      谷歌發布 Ironwood TPU 時,業界將其吹捧為專注于推理的利器,而這款 ASIC 芯片也被譽為英偉達的替代品,這主要是因為當時有說法稱 Jensen 尚未推出一款在推理吞吐量方面占據主導地位的解決方案。我們有 Rubin CPX,但我稍后會討論它。談到推理,計算需求會發生顯著變化,因為在訓練過程中,業界更看重吞吐量而非延遲和高運算強度,這也是為什么現代加速器都配備了 HBM 和海量張量核心的原因。

      由于超大規模數據中心正轉向推理,它們現在需要快速、可預測且前饋式的執行引擎,因為響應延遲是主要瓶頸。為了實現快速計算,NVIDIA 等公司針對大規模上下文推理(預填充和通用推理)等工作負載推出了 Rubin CPX,而 Google 則宣稱其 TPU 方案具有更高的能效。然而,在解碼方面,可供選擇的方案并不多。

      解碼是指Transformer模型推理過程中的詞元生成階段,它作為人工智能工作負載分類的關鍵環節,其重要性日益凸顯。解碼需要確定性和低延遲,而考慮到推理環境中使用HBM帶來的限制(延遲和功耗),Groq的獨特之處在于它使用了SRAM(靜態隨機存取存儲器)。既然我已經闡明了為什么需要重新審視推理計算,現在是時候討論LPU了。

      LPU是 Groq 前 CEO Jonathan Ross 的杰作,順便一提,他最近已加入 NVIDIA。Ross 因其在 Google TPU 方面的工作而聞名,因此我們可以肯定,NVIDIA 正在內部獲得一項重要的資產。LPU 是 Groq 針對推理類工作負載的解決方案,該公司區別于其他公司的關鍵在于其兩大核心優勢。首先是確定性執行和片上 SRAM 作為主要權重存儲。這是 Groq 通過確??深A測性來提升速度的方法。

      Groq此前已展示了兩款領先的解決方案:GroqChip和基于合作伙伴的GroqCard。根據官方文件披露的信息,這些芯片配備230MB片上SRAM,片上內存帶寬高達80TB/s。SRAM的使用是LPU的關鍵優勢之一,因為它能顯著降低延遲。與HBM相比,考慮到DRAM訪問和內存控制器隊列帶來的延遲,SRAM的優勢顯而易見。片上SRAM使Groq能夠實現數十TB/s的內部帶寬,從而提供領先的吞吐量。


      SRAM 還使 Groq 能夠提供一個節能平臺,因為訪問 SRAM 所需的每比特能量顯著降低,并消除了 PHY 開銷。此外,在解碼過程中,LPU 顯著降低了每個令牌的能耗,考慮到解碼工作負載是內存密集型的,這一點至關重要。這是 LPU 的架構方面,雖然這看似重要,但這只是 LPU 性能的一部分。另一個關鍵因素是利用確定性周期,即通過編譯時調度來消除內核間的時間差異。

      編譯時調度確保解碼流水線中不存在“延遲”,這是一個至關重要的因素,因為它能夠實現流水線的完美利用,從而相對于現代加速器實現更高的吞吐量??偠灾琇PU 完全專用于滿足超大規模數據中心所需的推理功能,但業界目前忽略了一個關鍵問題。LPU 是真實有效的推理硬件,但它們高度專業化,尚未成為主流的默認平臺,而這正是 NVIDIA 的用武之地。


      除了上述AGF的方法,將LPU集成到NVIDIA產品中的另一種方法是將其作為機架級推理系統(類似于Rubin CPX)的一部分,并搭配網絡基礎設施。這樣一來,GPU可以處理預填充/長上下文信息,而LPU則專注于解碼,這意味著在推理任務方面,NVIDIA已經解決了所有問題。這有望將LPU從實驗性選項轉變為標準推理方法,從而確保其在超大規模數據中心得到廣泛應用。

      毫無疑問,這筆交易標志著英偉達在推進其產品組合方面取得的最大成就之一,因為所有跡象都表明,推理將是英偉達接下來要討論的選項,而 LPU 將成為該公司在人工智能工作負載領域戰略的核心部分。

      為了規避反壟斷風險,選擇授權

      在日勤,CNBC率先報道了這一消息,聲稱英偉達將以200億美元的巨額交易“收購”Groq公司,這將是詹森·黃仁勛迄今為止最大的一筆收購。此消息在業內引發軒然大波,有人認為監管調查會阻礙這筆交易,也有人斷言Groq的末日已至。然而,隨后Groq在其官網上發布官方聲明,稱已與英偉達達成“非獨家許可協議”,授予這家人工智能巨頭使用其推理技術的權利。

      “我們計劃將 Groq 的低延遲處理器集成到 NVIDIA AI Factory 架構中,從而擴展該平臺,使其能夠服務于更廣泛的 AI 推理和實時工作負載。雖然我們正在吸納優秀人才并購買 Groq 的知識產權許可,但我們不會收購 Groq 這家公司?!庇ミ_首席執行官黃仁勛在一封內部郵件中表示

      因此,在Groq發表聲明后,至少從表面上看,合并的說法不攻自破?,F在看來,這一系列事件頗為耐人尋味,尤其是考慮到這筆交易距離被視為全面收購只差一步之遙,那就是官方披露中未提及此事。

      這是英偉達典型的“反向收購”策略。如果有人不知道這意味著什么,這是微軟的慣用伎倆。早在2024年,這家科技巨頭就宣布以6.53億美元收購Inflection,其中包括Mustafa Suleyman和Karén Simonya等人加入微軟,后者曾是微軟人工智能戰略的先鋒。

      反向收購是指一家公司從一家初創公司挖走關鍵人才,并保留“最基本的”公司架構,從而避免被認定為合并。現在看來,詹森似乎也采用了類似的策略來規避美國聯邦貿易委員會(FTC)的調查。他將與Groq的交易包裝成“非獨家許可協議”,從而使英偉達實際上游離于《哈特-斯科特-羅迪諾反壟斷改進法案》(HSR法案)的管轄范圍之外。值得注意的是,Groq提到GroqCloud將繼續運營,但僅以“精簡架構”的形式存在。

      事情的經過是這樣的:英偉達斥資200億美元收購了Groq的人才和知識產權,并成功避開了監管調查,從而在短短幾天內就完成了交易。而談到他們現在擁有的硬件資源,這才是英偉達收購Groq這筆交易中最引人注目的部分。

      大家怎么看這樁收購的后續走勢啊?

      (來源:半導體行業觀察綜合)

      *免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支持,如果有任何異議,歡迎聯系半導體行業觀察。

      今天是《半導體行業觀察》為您分享的第4271期內容,歡迎關注。

      加星標??第一時間看推送,小號防走丟



      求推薦


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      舒淇在節目里第一次承認,她和馮德倫為了要孩子已經折騰了九年。

      舒淇在節目里第一次承認,她和馮德倫為了要孩子已經折騰了九年。

      歲月有情1314
      2025-11-29 15:40:25
      中國不是就業難,是已經全面進入「零工社會」

      中國不是就業難,是已經全面進入「零工社會」

      匹夫來搞笑
      2025-12-28 13:12:18
      男子斥巨資給女友慶生,想擁抱被她躲開,網友:轉賬一停感情歸零

      男子斥巨資給女友慶生,想擁抱被她躲開,網友:轉賬一停感情歸零

      梅子的小情緒
      2025-12-08 20:21:41
      血戰沈家嶺:犧牲13名團級干部,3000余戰士倒在了新中國建立前夜

      血戰沈家嶺:犧牲13名團級干部,3000余戰士倒在了新中國建立前夜

      興趣知識
      2025-12-30 00:52:30
      看西班牙王后穿大衣,我悟了:裙過膝,衣不花哨不緊身,高級顯貴

      看西班牙王后穿大衣,我悟了:裙過膝,衣不花哨不緊身,高級顯貴

      八分搭配
      2025-11-30 00:06:13
      “成人奧斯卡”,丁度·巴拉斯實至名歸,細膩情感藝術,絕了

      “成人奧斯卡”,丁度·巴拉斯實至名歸,細膩情感藝術,絕了

      棱鏡電影
      2025-12-17 20:45:26
      發現用戶明確提出實施自殺、自殘等,由人工接管!事關AI,網信辦公開征求意見

      發現用戶明確提出實施自殺、自殘等,由人工接管!事關AI,網信辦公開征求意見

      每日經濟新聞
      2025-12-29 16:38:10
      失控了!中方反制美國對臺軍售,法德英罕見譴責美國,中歐要聯手

      失控了!中方反制美國對臺軍售,法德英罕見譴責美國,中歐要聯手

      來科點譜
      2025-12-29 09:01:29
      “莫斯科遭襲擊”

      “莫斯科遭襲擊”

      揚子晚報
      2025-12-28 21:55:26
      朱芳雨一家近照,42歲身家過億,二婚妻子好美,兒女雙全很幸福

      朱芳雨一家近照,42歲身家過億,二婚妻子好美,兒女雙全很幸福

      大西體育
      2025-12-23 10:26:59
      村干部工資新標準,2026年開始,村書記每個月拿多少錢?

      村干部工資新標準,2026年開始,村書記每個月拿多少錢?

      老特有話說
      2025-12-28 21:51:02
      美國軍火商洛馬公司因沒繳納中方開出990億罰單,后果竟如此嚴重

      美國軍火商洛馬公司因沒繳納中方開出990億罰單,后果竟如此嚴重

      百態人間
      2025-12-13 16:07:09
      科興吸附破傷風疫苗正式上市

      科興吸附破傷風疫苗正式上市

      界面新聞
      2025-12-29 08:22:16
      今天才知道:這10樣東西竟然是“玻璃纖維品”,用時可要當心!

      今天才知道:這10樣東西竟然是“玻璃纖維品”,用時可要當心!

      摳搜俠
      2025-12-01 16:21:49
      CBA積分榜一夜大變!上海沖到第1,廣東跌出前2,遼寧跌到第7

      CBA積分榜一夜大變!上海沖到第1,廣東跌出前2,遼寧跌到第7

      老吳說體育
      2025-12-30 00:00:58
      一個怪現象,現在人生病住院,連兄弟姐妹也瞞著,原因卻很現實

      一個怪現象,現在人生病住院,連兄弟姐妹也瞞著,原因卻很現實

      黑貓故事所
      2025-12-25 22:08:33
      金價、銀價,大跌!原因找到了

      金價、銀價,大跌!原因找到了

      極目新聞
      2025-12-29 17:03:22
      放牛老漢在山上發現一個女子,不顧女子的反抗,將女子拖回了家

      放牛老漢在山上發現一個女子,不顧女子的反抗,將女子拖回了家

      喬生桂
      2025-12-05 10:47:42
      確定!正式簽約,2米13臂展6號秀重返NBA,27歲啊,還能搏一搏

      確定!正式簽約,2米13臂展6號秀重返NBA,27歲啊,還能搏一搏

      球童無忌
      2025-12-29 13:58:45
      中國對日本出手了這么久,結果海關數據一公布,全都傻眼了!

      中國對日本出手了這么久,結果海關數據一公布,全都傻眼了!

      青青子衿
      2025-12-30 01:05:10
      2025-12-30 02:31:00
      半導體行業觀察 incentive-icons
      半導體行業觀察
      專注觀察全球半導體行業資訊
      12574文章數 34740關注度
      往期回顧 全部

      數碼要聞

      2025年度數碼好物大賞【年度評選】

      頭條要聞

      東部戰區戰士:收復寶島臺灣 已做好真打實打準備

      頭條要聞

      東部戰區戰士:收復寶島臺灣 已做好真打實打準備

      體育要聞

      “史上最貴”的世界杯,球迷成了韭菜

      娛樂要聞

      44歲林俊杰官宣戀情 帶23歲女友見家長

      財經要聞

      翁杰明:宏觀數據與居民微觀感受存在差距

      科技要聞

      肉搏非洲,傳音不想只當個賣手機的

      汽車要聞

      “路”要越走越深,猛士的智能越野時代來了

      態度原創

      旅游
      健康
      親子
      教育
      房產

      旅游要聞

      “雙節”期間去哪兒玩?揭陽超千場文化活動等你來!

      這些新療法,讓化療不再那么痛苦

      親子要聞

      寶媽必學,為什么孩子要“保護”侵犯自己的壞人?

      教育要聞

      高中地理核心知識考點總結,趕緊收藏!

      房產要聞

      中旅?三亞藍灣展示中心璀璨綻放,共鑒灣心孤品傳奇

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产精品久久久久久久9999| 久久精品亚洲精品国产色婷| 亚洲色偷偷色噜噜狠狠99网| 国产VA网站| 国产成人精品AA毛片| 在线免费观看毛片av| 国产漂亮白嫩美女在线观看| 麻豆性爱视频| 无码中文幕熟AⅤ一区二区| 性色在线视频精品| 亚洲AV无码乱码在线观看性色| 风流老熟女一区二区三区| 免费看视频的网站| 亚洲欧美在线综合一区二区三区| 午夜男在线一本| 亚洲成a人片在线观看www| 777米奇色狠狠888俺也去乱| av香港经典三级级 在线| 在线天堂中文字幕| 不卡在线一区二区三区视频| 亚洲亚洲人成综合网络| 国产成人无码久久久精品一| xxx日韩| 国产va免费精品观看| 亚洲日产韩国一二三四区| 2020国产成人精品视频| 亚洲精品久久久中文字幕痴女| 国内在线视频一区二区三区| 亚洲狠狠婷婷综合久久久| 精品一区二区三区四区五区| 无码不卡av东京热毛片| av区无码字幕中文色| 亚洲精品字幕| 亚洲精品久久久久国色天香| 3p在线看| 天天艹天天干| 亚洲123区| 欧美另类潮喷| 欧美福利精品| 琪琪福利视频| 日韩中文字幕高清有码|