<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      黃仁勛喊出“推理拐點”,邊緣推理的機會窗口打開了嗎

      0
      分享至

      上周,紐約時報報道了硅谷一個新風氣叫 tokenmaxxing,Meta 和 OpenAI 的工程師在內部搞 token 消耗量排行榜,比誰燒得多。黃仁勛在 GTC 2026 上更激進,提議企業給工程師發 token 預算,作為工資之外的第二份薪酬。

      OpenAI 的數據則顯示,過去一年企業客戶的推理 token 消耗量暴漲了約 320 倍。

      需求側在爆炸。供給側呢?

      黃仁勛在同一場 keynote 上搬出了 Tokenomics 這個概念,把它從加密貨幣的語境里拎出來,重新定義為 AI 推理的經濟學。核心指標叫 Tokens per Watt,衡量每瓦特電力能產出多少 token。他說推理拐點已經到了,NVIDIA 預計 Blackwell 和 Vera Rubin 芯片訂單量到 2027 年將達到 1 萬億美元。

      國內大模型廠商一直在講類似的事情,只是換了說法叫“推理成本”或者“token 單價”。不管哪種說法,指向的問題是一樣的,當 token 變成 AI 時代的水電煤,誰來建發電廠和電網?

      過去三年,行業給出的答案是,建更大的數據中心,塞更多的 GPU。這在訓練時代完全成立。但推理和訓練的邏輯不同。訓練一個模型是一次性工程,推理要做幾十億次,而且對延遲極度敏感。當推理請求像洪水一樣涌來,把所有 GPU 集中在幾個超大數據中心里,可能恰恰成了瓶頸。

      瓶頸不在算力,在物理。具體來說,在光速。

      推理時代撞上“光速墻”

      在今年 GTC 上,有一家公司對這個問題給出了非常系統的回答。

      Akamai,國內讀者可能不太熟悉這個名字,但在海外,它是 CDN 概念的開創者,也是目前全球最大的分布式計算平臺,擁有業內最龐大的邊緣節點網絡。1998 年成立,全球前十的視頻流媒體平臺、游戲公司、銀行基本都是它的客戶。全球擁有超過 4400 個邊緣入網點,覆蓋 130 多個國家,承載全球近三分之一的互聯網流量。

      這家公司在近三十年里經歷了三次轉型,從 CDN 到安全,再到云計算和 AI。今年 GTC 上,它帶來了兩個 session,核心主題只有一個,為什么 AI 推理必須走向分布式。

      Akamai CTO Office 的 SVP Andy Champagne 在 session 上描述了一個“個人 AI 導播”的場景,非常有畫面感。一場 F1 比賽有 20 多個 4K 機位同時在拍,傳統做法是導播間一個人切鏡頭,幾百萬觀眾看到的畫面一模一樣。但如果每個觀眾都能看到根據自己偏好定制的直播流,喜歡的車手、偏愛的鏡頭角度,那就需要在邊緣實時合成個性化的視頻。幾百萬路不同的 4K 視頻流,不可能從一個數據中心統一往外推。



      類似的邏輯出現在越來越多的實時場景里。

      游戲 NPC 需要在 50 毫秒內響應,超過這個閾值玩家體感明顯卡頓。Akamai 產品管理 VP Shawn Michels 在另一個 session 舉了實時廣告插入的例子,從掃描視頻、識別廣告位、競價、生成個性化廣告到拼回視頻流,整條鏈路的預算只有 100 毫秒。這恰恰是 Akamai 的先天優勢所在,它在全球已有超過 4400 個邊緣節點,這種“就近處理”的能力不是純云廠商從零搭建能輕易追上的。

      同樣的延遲壓力還存在于 AI 語音助手、電商推薦引擎、智能試衣間、自動駕駛傳感器處理和工業產線質檢等場景中。AI 一旦嵌入實時應用,就必須繼承那個應用原本的延遲要求。

      物理定律不會因為 GPU 更快就網開一面。光在光纖中每秒約跑 20 萬公里,從倫敦到美東數據中心單程延遲約 28 毫秒,往返就是 56 毫秒。從東京出發更遠,往返約 134 毫秒。這還沒算任何計算時間。

      回頭看上面那些場景的延遲要求,不難理解為什么把推理全部扔到少數幾個集中式數據中心里是行不通的。

      延遲之外還有帶寬。Andy 在 session 里算了一筆賬,同樣 1GW 的算力,如果集中在一個數據中心用 Blackwell 做視頻推理,出口帶寬需求是 75 Tbit/s。分布到 20 個區域節點,每個只需 3.75 Tbit/s。集中式的出口流量是分布式的 20 倍,背后的網絡成本差距不言而喻。

      如果換成下一代 Vera Rubin,集中式的出口帶寬更是飆到 135 Tbit/s。芯片越快,集中式架構的出口瓶頸反而越嚴重。

      在同一個 session 上,Comcast負責 AI 與邊緣計算方向的嘉賓從排隊論的角度做了更嚴謹的分析。在相同 GPU、相同模型的條件下,集中式和分布式部署之間僅僅 14 毫秒的往返延遲差異,就導致了約 30% 的 GPU 利用率差距。

      他的原話是,“這是物理定律層面的優勢,沒法靠 batching 或者提高 tokens/s 來彌補。”



      一個近三十年的伏筆

      Andy 在 session 上做了一個很有意思的類比,把 AI 的發展時間線和互聯網做對齊來看。互聯網的普及率已經超過 95%,AI 目前大約只有 7%。他的判斷是,AI 現在大概處于互聯網的 MySpace 時代。

      想想 MySpace 之后又誕生了多少公司、多少市值、多少技術突破。AI 的好戲才剛剛開始。

      這個類比其實點出了 Akamai 做分布式推理的底層邏輯。近三十年前這家公司解決的問題和今天面對的問題,結構上是一樣的,把集中的東西變成分布的。當年分發的是網頁和視頻,現在分發的是 AI 推理。方法論一脈相承。

      他在 session 結尾說了兩句話,頗能概括這種邏輯,“AI 工廠創造智能,AI Grid 分發智能”,以及“沒有分布式推理的 AI,就像沒有 CDN 的互聯網”。



      GTC 期間,NVIDIA 官方將 Akamai Cloud 和 AWS 一起列為首批提供 RTX PRO Blackwell Server Edition 實例的云服務商。黃仁勛 keynote 展示的合作伙伴 logo 墻上,Akamai 赫然在列。NVIDIA 電信業務全球副總裁 Chris Penrose 評價說,Akamai 通過運營 AI Grid,正在為生成式 AI、AI Agent 和物理 AI 構建連接組織,將智能直接推送到數據所在的地方。

      Akamai 也在 GTC 上正式發布了業界首個全球規模落地 NVIDIA AI Grid 參考架構的方案,將 NVIDIA AI 基礎設施深度集成到自身的分布式網絡中。這不是一個松散的合作。Akamai 是首家將 AI Grid 從概念推到運營級別的廠商,底層跑的是 NVIDIA AI Enterprise 軟件棧、Blackwell 架構 GPU 和 BlueField DPU 加速網絡的完整技術棧。

      推理基礎設施的幾個現實問題

      回到地面,對于正在考慮推理部署的 AI 團隊,有幾個繞不開的現實問題。

      不是所有推理都需要 H100。 這個認知正在被越來越多團隊接受。H100 為訓練和大規模推理而生,但如果跑的是 8B 參數的模型、做的是語音交互或者視頻分析,用 H100 就像開卡車送外賣。

      Akamai 目前部署的 RTX PRO 6000 Blackwell Server Edition 是一個值得關注的選項。直接看 Token 經濟,$2.50/小時全包價,每美元 Token 產出是同類方案的 2.1 倍。

      性能層面,這張卡配了 96GB GDDR7 顯存和 4,000 TOPS FP4 算力,在 NVFP4 精度下推理吞吐量比 H100 高出 60% 以上,對比上一代 RTX 4000 Ada 提升達 19 倍。另一個容易被忽略的差異是視頻處理能力,RTX PRO 6000 原生支持 112 到 132 路視頻編解碼,如果做的是視覺 AI 相關的產品,這個能力是定位于訓練和超算的 H100 不具備的。

      再加上風冷設計,在邊緣機房有限的空間和功耗條件下部署門檻低得多。Shawn Michels 在 GTC session 里的觀點說的是未來的推理基礎設施一定是混合架構,不同 GPU 匹配不同的工作負載,沒有萬能卡。

      Egress 費用是隱性殺手。 很多團隊做預算時只看 GPU 租用價格,忽略了數據出站費。AI 產品服務全球用戶,視頻和模型響應產生的出站流量成本可能比 GPU 本身還貴。

      邊緣部署的經濟邏輯之一正在于此,推理結果在本地生成、本地交付,不用跨大半個地球回傳。Akamai 的 egress 價格是 $0.005/GB,和三大云廠商的差距非常明顯。

      調度比算力更難。 GPU 散到全球各地只是第一步,更難的是讓每個請求找到最合適的那臺機器。Akamai 在 GTC 上展示了他們的 AI 編排器(Orchestrator),這不是傳統的根據延遲和負載來分配流量的負載均衡。

      它會考慮模型親和性(哪臺機器已經加載了需要的模型)、GPU 顯存占用、KV Cache 狀態等 AI 場景特有的因素來做實時路由決策。現場 demo 中,推理請求從巴黎節點實時切換到加州節點,用戶側完全無感知。這背后是 Akamai 做了近三十年流量調度的老本行,在 AI 場景上的自然延續。

      目前 Akamai 的 Blackwell GPU 節點已覆蓋歐洲、亞太和美洲共 19 個節點,配合 4400 多個邊緣入網點協同工作。對于出海的 AI 團隊來說,東京、新加坡、孟買、雅加達這些亞太節點尤其值得留意。



      出海 AI 創業者的第三種選擇

      Akamai 從 CDN 到安全,再到云計算和 AI 推理的轉型路徑,本身就是互聯網基礎設施演進的一個切面。它在這條賽道上的差異化在于,不是從零建數據中心,而是把已經運行了近三十年的全球分布式網絡變成了 AI 推理的底座。

      這步棋能走多遠,取決于它能不能跟上 AI 硬件更新的速度,也取決于邊緣推理的市場需求能否如預期般爆發。

      但對中國出海 AI 創業者來說,一件事正在變得越來越清楚,全球化部署推理能力正在從“以后再說”變成“現在就得解決”。

      合規(數據主權、不出境)、延遲(用戶體驗的硬門檻)、成本(egress 和 GPU 租用的真實賬單),這是出海時最現實的三座山。Akamai 的邊緣推理平臺提供了一種此前不太存在的選擇,不必自建全球基礎設施,也不必把雞蛋全放在幾家超大規模云上,而是可以借助一張已經覆蓋 130 多個國家的分布式網絡,把推理跑到離用戶最近的地方去。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      梅西在巴薩最后一個賽季的保時捷卡宴將被拍賣,里程2萬公里

      梅西在巴薩最后一個賽季的保時捷卡宴將被拍賣,里程2萬公里

      懂球帝
      2026-04-10 23:15:10
      印度曾反對中國建雅魯藏布江水電站,現才徹底明白,真不是一般精

      印度曾反對中國建雅魯藏布江水電站,現才徹底明白,真不是一般精

      掠影后有感
      2026-04-06 11:40:04
      繼德國之后,英國也開始貼出“中文標語”?中國游客:不能夠接受

      繼德國之后,英國也開始貼出“中文標語”?中國游客:不能夠接受

      潮鹿逐夢
      2026-04-02 12:31:48
      阿斯:埃德松轉會陷入僵局,馬競希望壓低4500萬歐元的轉會費

      阿斯:埃德松轉會陷入僵局,馬競希望壓低4500萬歐元的轉會費

      懂球帝
      2026-04-11 07:24:22
      賠光2億后,冉瑩穎獨自搬家30箱未給鄒市明留體面

      賠光2億后,冉瑩穎獨自搬家30箱未給鄒市明留體面

      春之韻
      2026-03-18 09:32:52
      海港VS申花:4外援坐鎮 國足中場新星領銜 兩大功勛老將替補待命

      海港VS申花:4外援坐鎮 國足中場新星領銜 兩大功勛老將替補待命

      零度眼看球
      2026-04-11 07:11:21
      上海剮蹭鬧劇:全責還罵別人是“破奧迪”,一句回懟直接破防開罵

      上海剮蹭鬧劇:全責還罵別人是“破奧迪”,一句回懟直接破防開罵

      今朝牛馬
      2026-04-10 22:45:22
      開國上將鬧離婚:結發40年竟遭發妻死命舉報,六名子女為何如釋重負

      開國上將鬧離婚:結發40年竟遭發妻死命舉報,六名子女為何如釋重負

      睡前講故事
      2026-04-07 14:43:34
      西北大學終于坐不住了!

      西北大學終于坐不住了!

      梳子姐
      2026-04-09 11:44:17
      沒有這種食物,你的肌肉將消失!醫生:60歲后恢復肌力的7種食物

      沒有這種食物,你的肌肉將消失!醫生:60歲后恢復肌力的7種食物

      健康之光
      2026-01-04 09:31:45
      離譜?姆巴佩空門踢呲+20次丟球權!獲5.8分最低,西甲已4場球荒

      離譜?姆巴佩空門踢呲+20次丟球權!獲5.8分最低,西甲已4場球荒

      我愛英超
      2026-04-11 06:22:51
      妮可·基德曼頂3斤假發亮相,Schiaparelli高定秒變淘寶

      妮可·基德曼頂3斤假發亮相,Schiaparelli高定秒變淘寶

      熱搜摘要官
      2026-04-10 08:02:47
      鄭麗文想要的,大陸給得很爽快,隨行人員有驚喜,藍營一姐發話了

      鄭麗文想要的,大陸給得很爽快,隨行人員有驚喜,藍營一姐發話了

      閱微札記
      2026-04-10 19:55:07
      《妻子浪漫旅行》最尷尬的夫妻,話少還裝甜蜜,沒李純馬頔自然

      《妻子浪漫旅行》最尷尬的夫妻,話少還裝甜蜜,沒李純馬頔自然

      一娛三分地
      2026-04-09 19:22:11
      臺州保時捷事件后續:警方通報處理結果,車主身份曝光,太意外了

      臺州保時捷事件后續:警方通報處理結果,車主身份曝光,太意外了

      奇思妙想草葉君
      2026-04-10 21:54:35
      東部最新排名!76人掉隊,騎士首輪對手變了,三大魚腩沖狀元簽

      東部最新排名!76人掉隊,騎士首輪對手變了,三大魚腩沖狀元簽

      體壇小李
      2026-04-10 11:29:59
      TVB港姐冠軍內地真人秀人氣急升,收花當場爆喊,獲贊像公主

      TVB港姐冠軍內地真人秀人氣急升,收花當場爆喊,獲贊像公主

      東方不敗然多多
      2026-04-11 03:27:35
      你見過哪些悶聲發大財的人?網友:干這個買三套房子,兩個門面

      你見過哪些悶聲發大財的人?網友:干這個買三套房子,兩個門面

      夜深愛雜談
      2026-02-01 18:57:04
      新生代主持李瑜,綠裙赤足展玉足,這清純性感誰頂得住?

      新生代主持李瑜,綠裙赤足展玉足,這清純性感誰頂得住?

      娛樂領航家
      2026-04-10 21:30:03
      華為新款AI眼鏡由歌爾股份代工

      華為新款AI眼鏡由歌爾股份代工

      財聯社
      2026-04-10 11:18:07
      2026-04-11 07:47:00
      硅星人 incentive-icons
      硅星人
      硅(Si)是創造未來的基礎,歡迎來到這個星球。
      2997文章數 10481關注度
      往期回顧 全部

      科技要聞

      馬斯克狂發大火箭也養不起AI 年虧50億美元

      頭條要聞

      推動停火 巴基斯坦被指取得近年來最大的外交勝利之一

      頭條要聞

      推動停火 巴基斯坦被指取得近年來最大的外交勝利之一

      體育要聞

      17歲賺了一百萬美元,25歲被CBA裁員

      娛樂要聞

      黃景瑜王玉雯否認戀情!聚會細節被扒

      財經要聞

      李強主持召開經濟形勢專家和企業家座談會

      汽車要聞

      搭載第二代刀片電池及閃充技術 騰勢N8L閃充版預售35萬起

      態度原創

      教育
      家居
      親子
      游戲
      軍事航空

      教育要聞

      一年級壓軸題,全班都不會

      家居要聞

      復古風格 自然簡約

      親子要聞

      時間會融化所有尖銳,只剩平靜

      任天堂獨占傳統不再!經典作品跨平臺引粉絲不滿

      軍事要聞

      特朗普:對美國與伊朗達成和平協議“非常樂觀”

      無障礙瀏覽 進入關懷版