<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      關(guān)于Rubin,我們列了六個(gè)關(guān)鍵問題

      0
      分享至



      新眸原創(chuàng)·作者 | 李小東

      英偉達(dá)沒有在CES 2026上發(fā)布任何新的顯卡。

      取而代之的,黃仁勛用近兩個(gè)小時(shí),詳細(xì)闡述了一個(gè)名為Vera Rubin的全新AI超算架構(gòu),以及一組足以改寫行業(yè)規(guī)則的數(shù)字:

      在Rubin上運(yùn)行AI推理,吞吐量提升十倍,訓(xùn)練萬億參數(shù)模型所需的GPU數(shù)量,可以減少到上一代Blackwell的四分之一,而每個(gè)token的成本降至十分之一。

      這件事可能埋了個(gè)信號。

      它或許預(yù)示,在傳統(tǒng)消費(fèi)級GPU這條線上,通過制程和架構(gòu)微迭代帶來的性能提升,其邊際效應(yīng)正在減弱,或者說,已不足以支撐一個(gè)激動人心的發(fā)布會。

      以下是我們就此事的一些思考。

      01

      關(guān)于沒有新顯卡與Rubin的商業(yè)模式

      理解Rubin,關(guān)鍵在于轉(zhuǎn)變視角。

      它不是一個(gè)更快的GPU,你可以把它視為一套極度垂直整合的AI計(jì)算系統(tǒng)。英偉達(dá)設(shè)計(jì)了六顆功能各異、但深度耦合的專用芯片去進(jìn)行打包:

      Vera CPU(負(fù)責(zé)AI數(shù)據(jù)流調(diào)度)、Rubin GPU(核心算力單元)、NVLink 6(超高帶寬內(nèi)部互聯(lián))、ConnectX-9 SuperNIC(AI專用網(wǎng)絡(luò))、BlueField-4 DPU(卸載存儲與安全任務(wù))、Spectrum-6以太網(wǎng)交換芯片。

      六塊芯片協(xié)同工作,目標(biāo)是將整個(gè)數(shù)據(jù)中心機(jī)柜整合為一臺無縫的“巨型AI計(jì)算機(jī)”。



      Rubin解決的,是系統(tǒng)規(guī)模化的難題,不是單顆芯片的性能極限。讓算力的堆疊,從“手工組裝賽車引擎”變?yōu)椤皹?biāo)準(zhǔn)化汽車工廠流水線”,至于帶來的效率提升和成本下降,是系統(tǒng)級優(yōu)化的必然結(jié)果。

      這種模式,確實(shí)與谷歌通過TPU及其互聯(lián)技術(shù)打造自家AI基礎(chǔ)設(shè)施的思路異曲同工。英偉達(dá)的Rubin,正是面向那些與谷歌有相似需求的客戶——即需要處理海量Token、訓(xùn)練和運(yùn)行萬億參數(shù)模型的超大規(guī)模AI廠商或云服務(wù)商。

      對比英偉達(dá)在這之前的商業(yè)模式,有一些從“賣鏟子”到“賣生產(chǎn)力車間” 的商業(yè)模式的轉(zhuǎn)向。它帶來的性能提升(如10倍推理吞吐)和成本下降(1/10的Token成本),是這種專用化、系統(tǒng)級優(yōu)化所能釋放的潛力。

      但它的限制也在于此。

      Rubin的威力只有在處理其預(yù)設(shè)的、高度并行化的AI計(jì)算負(fù)載時(shí)才能完全釋放。對于圖形渲染、通用科學(xué)計(jì)算或小規(guī)模模型推理等場景,其復(fù)雜性和成本可能并不劃算。它瞄準(zhǔn)的是一個(gè)龐大但特定的“主航道”市場。

      02

      關(guān)于對現(xiàn)有AI硬件生態(tài)的沖擊

      Rubin的出現(xiàn),會不會讓“囤積高端GPU”作為核心競爭力的時(shí)代,開始進(jìn)入倒計(jì)時(shí)?

      如果說,Rubin真的能夠達(dá)到市場普及,隨之而來就要面對一些尷尬情況:

      對于第一波靠買賣或租賃算力(如H100集群)的廠商,他們的商業(yè)模式將承受巨大壓力。當(dāng)新一代系統(tǒng)能以低得多的單位成本提供推理服務(wù)時(shí),舊有集群的性價(jià)比優(yōu)勢會迅速喪失,除非他們能快速升級到新架構(gòu)。

      而對于那些早期投入巨資自建GPU集群的AI公司,他們的處境更為微妙。這些硬件資產(chǎn)短期內(nèi)不會報(bào)廢,依然能用于研發(fā)和現(xiàn)有服務(wù)。

      但問題在于未來的競爭維度。

      當(dāng)新入場的玩家可以憑借Rubin級別的廉價(jià)算力,輕松獲得與你相當(dāng)?shù)耐评砟芰r(shí),你之前用巨額資本構(gòu)筑的算力壁壘,戰(zhàn)略價(jià)值就會急劇縮水。競爭將更快地、更徹底地轉(zhuǎn)向模型算法本身的優(yōu)越性、數(shù)據(jù)的獨(dú)特性和閉環(huán),以及產(chǎn)品與市場的契合度。

      英偉達(dá)自身的角色,也會因此在演變。它確實(shí)在向“AI時(shí)代的高通”靠攏,即提供核心的、標(biāo)準(zhǔn)化的計(jì)算模塊。但Rubin所展現(xiàn)的集成度,又比手機(jī)SoC復(fù)雜得多,更接近于提供一整套參考設(shè)計(jì)和系統(tǒng)解決方案。

      未來,如果其超算架構(gòu)(如DGX SuperPOD)以云服務(wù)形式被大規(guī)模交付,那么它還將附加一層“運(yùn)營商”的屬性,直接向終端用戶輸出AI算力服務(wù)。

      03

      關(guān)于Token平價(jià)時(shí)代的窗口期問題

      Rubin所承諾的“平價(jià)推理時(shí)代”,其窗口期的長短,取決于兩個(gè)關(guān)鍵變量:Rubin的銷量爬坡速度,以及現(xiàn)有巨頭模型能力的迭代速度。

      如果Rubin能在2026年下半年如期規(guī)模上市,并快速被主要云廠商(如AWS、Azure、GCP)部署,那么這個(gè)“平價(jià)算力”的接入點(diǎn)就會迅速普及。

      窗口期可能并不長。在這段時(shí)間里,存量公司必須完成從“依賴硬件規(guī)模”到“依賴軟件和生態(tài)優(yōu)勢”的關(guān)鍵轉(zhuǎn)型。

      具體來說,他們可能需要:利用現(xiàn)有算力優(yōu)勢,加速訓(xùn)練出具有代際差異的模型,建立足夠高的算法壁壘;將業(yè)務(wù)迅速與具體商業(yè)場景深度綁定,形成數(shù)據(jù)閉環(huán)和客戶粘性,讓算力成本不再是決定性因素;積極探索基于現(xiàn)有模型的創(chuàng)新應(yīng)用和生態(tài),在平價(jià)算力浪潮到來前,占據(jù)用戶心智和市場份額。

      當(dāng)大家獲取先進(jìn)算力的成本拉平時(shí),那些僅靠算力堆砌而無獨(dú)特技術(shù)或產(chǎn)品護(hù)城河的公司,優(yōu)勢可能很快蒸發(fā)。

      04

      關(guān)于AI泡沫與下一代種子選手

      需要注意的是,Rubin的大規(guī)模投入,是為AI商業(yè)價(jià)值的全面實(shí)現(xiàn),拆除了最大的成本和規(guī)模障礙,但它本身并不能自動創(chuàng)造價(jià)值。

      簡單來說,解決的是“成本可不可行”問題,而不是“需求存不存在”問題。

      AI泡沫論常質(zhì)疑的是:天價(jià)訓(xùn)練成本能否產(chǎn)生與之匹配的商業(yè)價(jià)值?Rubin將成本打下來,實(shí)際上是大幅降低了驗(yàn)證商業(yè)價(jià)值的門檻。

      更多的創(chuàng)業(yè)團(tuán)隊(duì)可以用可承受的成本,去測試更激進(jìn)、更復(fù)雜的AI想法。因此,接下來的邏輯不是泡沫破裂,行業(yè)可能正從依靠資本堆砌的蠻力階段,進(jìn)入一個(gè)更健康、更依賴創(chuàng)新而非資本的篩選階段。

      最先能有效利用Rubin級別算力的創(chuàng)業(yè)者,未必是現(xiàn)在資金最雄厚的,但一定是對AI原生應(yīng)用有最深洞察、最能發(fā)揮廉價(jià)推理潛力的團(tuán)隊(duì)。他們可能是下一代“殺手級應(yīng)用”的種子選手。

      從這個(gè)角度來看,長遠(yuǎn)一些,以往算力的天價(jià)成本導(dǎo)致只有少數(shù)玩家能入場,他們的故事建立在“我有稀缺算力”的基礎(chǔ)上,商業(yè)價(jià)值驗(yàn)證被推遲。

      Rubin之后的新邏輯是,算力門檻驟降,入場玩家會激增。當(dāng)然,這可能會導(dǎo)致大量同質(zhì)化應(yīng)用涌現(xiàn),市場競爭會瞬間變得極為殘酷。因?yàn)樵S多僅僅依靠“我有AI功能”的應(yīng)用將迅速失去價(jià)值,因?yàn)樗鼈儫o法在成本相近的情況下提供獨(dú)特優(yōu)勢。

      真正的價(jià)值創(chuàng)造者(擁有獨(dú)特?cái)?shù)據(jù)、精妙算法、深刻行業(yè)洞察的團(tuán)隊(duì))會脫穎而出,而裸泳者會更快暴露。所以,Rubin的到來可能并不意味著泡沫結(jié)束,恰恰是一輪更劇烈的淘汰賽開始。

      05

      關(guān)于不推新顯卡的深層原因

      作為天才銷售大師的黃仁勛,在這次CES全球大會上沒有推銷顯卡,這件事本身是很值得討論的,我們甚至可以合理猜測,在半導(dǎo)體物理邊界下,已經(jīng)逼近創(chuàng)新極限?

      在傳統(tǒng)GPU的晶體管微縮競賽中,持續(xù)實(shí)現(xiàn)代際性能飛躍的難度確實(shí)在增加。與此同時(shí),AI數(shù)據(jù)中心市場的增長曲線和利潤空間,已經(jīng)形成了絕對的戰(zhàn)略引力。

      在先進(jìn)封裝、HBM內(nèi)存等產(chǎn)能可能依然全局緊張的背景下,英偉達(dá)選擇將資源(研發(fā)、產(chǎn)能、市場聲量)絕對優(yōu)先地投入到?jīng)Q定其未來的AI基礎(chǔ)設(shè)施戰(zhàn)場,有一定的必然性。

      另一方面,在過去一年里,英偉達(dá)的行業(yè)統(tǒng)治地位或多活動受到不少挑戰(zhàn),尤其是來源于谷歌這類科技公司的一些顛覆。

      在缺乏制程紅利或架構(gòu)顛覆性突破的情況下,匆忙推出小幅升級的產(chǎn)品,反而可能打亂市場節(jié)奏、影響現(xiàn)有產(chǎn)品線(如RTX 40系)的銷售。英偉達(dá)有資本選擇等待一個(gè)更合適的發(fā)布時(shí)機(jī)。

      06

      更實(shí)際的問題

      拋開以上,還有兩個(gè)非常實(shí)際的問題:一是從現(xiàn)有架構(gòu)遷移到Rubin的更新成本與收益是否匹配;二是新架構(gòu)下硬件必然會存在的穩(wěn)定性與魯棒性風(fēng)險(xiǎn)。

      對于從業(yè)者來說,從Blackwell或更早架構(gòu)遷移到Rubin,遠(yuǎn)不止一次簡單的硬件采購。

      最典型的例子,集成六種尖端芯片、采用全液冷設(shè)計(jì)的Rubin系統(tǒng),其單機(jī)柜或單托盤的價(jià)格必然極其昂貴,會顯著高于當(dāng)前一代系統(tǒng)。

      還有他們的計(jì)算邏輯,客戶不會單純?yōu)榱水?dāng)前的算力付費(fèi),他們要購買一張通往下一代AI成本結(jié)構(gòu)的門票。核心比較指標(biāo)非“總擁有成本(TCO)”,而是 “單位智能成本(Cost Per Intelligence)”——即處理每萬億token、訓(xùn)練每個(gè)萬億參數(shù)模型的綜合開銷。

      那劃不劃得來呢?對于極度稀缺、高速迭代的前沿模型研發(fā)(如追求AGI的實(shí)驗(yàn)室)和超大規(guī)模AI云服務(wù)商來說,答案很可能是肯定的。

      即便硬件單價(jià)高,但若能將其服務(wù)的天量Token推理成本降低一個(gè)數(shù)量級,或在競品之前以數(shù)月時(shí)間優(yōu)勢推出更強(qiáng)大的模型,這筆投資就能在極短時(shí)間內(nèi)通過市場領(lǐng)先地位和更低的運(yùn)營成本收回。這是為生存和領(lǐng)先而戰(zhàn)。

      除了這些,還有遷移與適配的隱性成本。比如,Rubin的NVFP4張量核心、新的內(nèi)存層次(如由BlueField-4驅(qū)動的上下文存儲平臺)以及CPU-GPU協(xié)同模式,都需要對現(xiàn)有的深度學(xué)習(xí)框架、模型架構(gòu)和調(diào)度軟件進(jìn)行深度優(yōu)化,甚至重寫部分代碼。這需要投入大量工程師時(shí)間和驗(yàn)證成本。

      決策者還要考慮什么時(shí)候回本,比如:

      基于Rubin更低廉的Token成本,自己的業(yè)務(wù)量(推理請求、模型訓(xùn)練任務(wù))將增長多少?新架構(gòu)帶來的能效提升,能節(jié)省多少電力成本?與“維持舊系統(tǒng),但承擔(dān)更高邊際成本和逐漸喪失競爭力”的路徑相比,提前投資Rubin的凈現(xiàn)值(NPV)是否為正?

      對于大多數(shù)企業(yè),這個(gè)平衡點(diǎn)可能不會立即到來。

      另一方面,關(guān)于穩(wěn)定性與魯棒性,是這種系統(tǒng)級極致創(chuàng)新的天然反面。

      對于任一硬件工藝,復(fù)雜度激增必然帶來故障點(diǎn)的擴(kuò)散。傳統(tǒng)的GPU集群有一兩個(gè)出現(xiàn)問題,任務(wù)可遷移解決。但Rubin是一個(gè)超級有機(jī)體,內(nèi)部(Vera CPU、Rubin GPU、NVLink 6、DPU、超級網(wǎng)卡)精密耦合,任何一個(gè)關(guān)鍵部件的異常,都可能影響整個(gè)系統(tǒng)的協(xié)同效率。

      對于工程師來說,故障診斷難度大概率也會上升。當(dāng)性能問題或錯誤出現(xiàn)時(shí),排查的根源可能是硬件(六種芯片中的任何一種)、固件、驅(qū)動、互聯(lián)協(xié)議或系統(tǒng)軟件中的任何一環(huán)。這種深度集成使得傳統(tǒng)“分而治之”的調(diào)試方法變得異常困難。

      我們也注意到,針對這幾個(gè)風(fēng)險(xiǎn),老黃在演講中回應(yīng)了幾項(xiàng)特性,如全鏈路機(jī)密計(jì)算與加密、徹底重新設(shè)計(jì)的供電與冷卻、通過DPU實(shí)現(xiàn)“卸載”與“隔離”。

      只不過,無論設(shè)計(jì)多么精妙,一套如此復(fù)雜的新系統(tǒng),也必須經(jīng)過大規(guī)模、長時(shí)間、多樣化實(shí)際工作負(fù)載的淬火才能得到驗(yàn)證。

      按照以往的經(jīng)驗(yàn),早期采用者將不可避免地承擔(dān)“共同測試者”的角色,與英偉達(dá)一同發(fā)現(xiàn)并解決那些在實(shí)驗(yàn)室中無法預(yù)見的問題。

      這個(gè)過程可能需要更長時(shí)間。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      老了才明白:父母一旦超過81,立刻停止兩種行為,否則晚景或凄涼

      老了才明白:父母一旦超過81,立刻停止兩種行為,否則晚景或凄涼

      三農(nóng)老歷
      2026-03-19 13:59:41
      局勢惡化,中方接到通知,美軍正做軍事準(zhǔn)備,首個(gè)替死鬼已浮現(xiàn)

      局勢惡化,中方接到通知,美軍正做軍事準(zhǔn)備,首個(gè)替死鬼已浮現(xiàn)

      清衣渡a
      2026-04-16 05:23:23
      歐冠:阿森納次回合0-0悶平,1-0總比分晉級半決賽對陣馬競

      歐冠:阿森納次回合0-0悶平,1-0總比分晉級半決賽對陣馬競

      劉剮說體壇
      2026-04-16 05:35:45
      歐冠4強(qiáng)出爐!半決賽對陣:大巴黎拜仁迎巔峰對決,馬競VS阿森納

      歐冠4強(qiáng)出爐!半決賽對陣:大巴黎拜仁迎巔峰對決,馬競VS阿森納

      我愛英超
      2026-04-16 05:13:52
      退休后才發(fā)現(xiàn),一個(gè)人有錢沒錢,一眼就能看出:沒錢的人,大多有這3個(gè)“窮習(xí)慣”

      退休后才發(fā)現(xiàn),一個(gè)人有錢沒錢,一眼就能看出:沒錢的人,大多有這3個(gè)“窮習(xí)慣”

      風(fēng)起見你
      2026-04-11 15:31:29
      你們都是什么時(shí)候?qū)δ信麻_竅的?網(wǎng)友:果然還是攔不住有心人

      你們都是什么時(shí)候?qū)δ信麻_竅的?網(wǎng)友:果然還是攔不住有心人

      夜深愛雜談
      2026-02-21 21:37:02
      陰雨綿長像犯春困!春晴三日緊急上線湖北,30℃夏韻初現(xiàn)

      陰雨綿長像犯春困!春晴三日緊急上線湖北,30℃夏韻初現(xiàn)

      極目新聞
      2026-04-15 18:49:32
      上海90-89險(xiǎn)勝廣州,王哲林20+16,誰是本場最佳?數(shù)據(jù)不說謊!

      上海90-89險(xiǎn)勝廣州,王哲林20+16,誰是本場最佳?數(shù)據(jù)不說謊!

      桃葉渡春
      2026-04-16 01:40:49
      價(jià)格波動正常,外部勢力莫亂攪局

      價(jià)格波動正常,外部勢力莫亂攪局

      烽火瞭望者
      2026-04-15 06:15:55
      曝崩牙駒“左右手”潮州明去世!晚年凄涼,和勝和前坐館發(fā)文悼念

      曝崩牙駒“左右手”潮州明去世!晚年凄涼,和勝和前坐館發(fā)文悼念

      裕豐娛間說
      2026-04-15 08:01:01
      曝《寂靜嶺》等大作將被國內(nèi)禁售!全平臺下架封禁

      曝《寂靜嶺》等大作將被國內(nèi)禁售!全平臺下架封禁

      游民星空
      2026-04-13 11:12:18
      里程碑!周鵬職業(yè)生涯出場次數(shù)達(dá)800場,位列CBA歷史首位

      里程碑!周鵬職業(yè)生涯出場次數(shù)達(dá)800場,位列CBA歷史首位

      懂球帝
      2026-04-15 20:46:42
      外媒:SpaceX在約19小時(shí)內(nèi)完成兩次星鏈衛(wèi)星發(fā)射

      外媒:SpaceX在約19小時(shí)內(nèi)完成兩次星鏈衛(wèi)星發(fā)射

      CNMO科技
      2026-04-15 18:16:11
      成都老小區(qū)深夜開門收費(fèi)1-2元 網(wǎng)友吐槽:以后加班都不敢了 怕回不起家

      成都老小區(qū)深夜開門收費(fèi)1-2元 網(wǎng)友吐槽:以后加班都不敢了 怕回不起家

      閃電新聞
      2026-04-15 23:25:35
      切爾西遭炮轟!放走頂級巨星釀致命惡果,傳奇怒批:誰干的查到底

      切爾西遭炮轟!放走頂級巨星釀致命惡果,傳奇怒批:誰干的查到底

      瀾歸序
      2026-04-16 05:06:45
      55歲男人:意外跟老婆閨蜜發(fā)生關(guān)系,這件事我應(yīng)該告訴老婆嗎?

      55歲男人:意外跟老婆閨蜜發(fā)生關(guān)系,這件事我應(yīng)該告訴老婆嗎?

      烙任情感
      2026-04-14 21:54:31
      一線記者傳回中東戰(zhàn)報(bào),伊朗國內(nèi)的慘烈程度,遠(yuǎn)比想象中大得多

      一線記者傳回中東戰(zhàn)報(bào),伊朗國內(nèi)的慘烈程度,遠(yuǎn)比想象中大得多

      阿器談史
      2026-04-13 12:08:12
      忍無可忍!25萬捷克人上街怒吼:我們拒絕成為下一個(gè)匈牙利

      忍無可忍!25萬捷克人上街怒吼:我們拒絕成為下一個(gè)匈牙利

      阿鳧愛吐槽
      2026-03-24 17:59:04
      世錦賽爆冷門:1-5號種子無緣正賽,比分5-10

      世錦賽爆冷門:1-5號種子無緣正賽,比分5-10

      小驛拍客在北漂
      2026-04-16 04:42:50
      諾獎得主怒批歐洲對伊朗鎮(zhèn)壓本國人民“裝聾作啞”

      諾獎得主怒批歐洲對伊朗鎮(zhèn)壓本國人民“裝聾作啞”

      桂系007
      2026-04-15 22:54:19
      2026-04-16 06:15:00
      新眸深度 incentive-icons
      新眸深度
      看見商業(yè)另一面。
      1473文章數(shù) 2477關(guān)注度
      往期回顧 全部

      科技要聞

      ChatGPT十億用戶又怎樣?Anthropic直接貼臉

      頭條要聞

      美國發(fā)布新一輪涉伊朗制裁措施

      頭條要聞

      美國發(fā)布新一輪涉伊朗制裁措施

      體育要聞

      三球準(zhǔn)絕殺戴大金鏈:轟30+10自我救贖

      娛樂要聞

      謝娜現(xiàn)身環(huán)球影城,牽手女兒溫馨有愛

      財(cái)經(jīng)要聞

      業(yè)績失速的Lululemon:"健康"人設(shè)崩塌?

      汽車要聞

      空間絲毫不用妥協(xié) 小鵬GX首發(fā)評測

      態(tài)度原創(chuàng)

      家居
      手機(jī)
      數(shù)碼
      游戲
      公開課

      家居要聞

      簡而不減 暖居之道

      手機(jī)要聞

      一加Ace6至尊版再次被確認(rèn):魔改天璣9500+165Hz屏,本月發(fā)布!

      數(shù)碼要聞

      明基新款顯示器首發(fā)12499元:4K專業(yè)級色彩校準(zhǔn) 根據(jù)環(huán)境光自動調(diào)整

      《GTA6》搶劫玩法泄露引熱議!NPC與警察全面升級

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版