<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      這么大,那么猛,超節點到底中用不中用?

      0
      分享至

      在「賣盒子」領域,今年火了兩樣產品。

      上半年火的是大模型一體機,下半年火的是“又大又猛”的超節點。



      一眾大廠紛紛推出自家的超節點,但是,隨著超節點的發布和落地,爭議也越來越多(以下按發布順序簡列)。



      今天我們就系統地講講,超節點到底中用不中用?

      什么是超節點?

      首先,我們要明確一點,一臺標準服務器是插不了太多GPU卡的,16卡是極限。

      這主要受限于CPU的PCIe通道數以及工程因素(比如機箱空間、散熱、供電)。



      所以,這類傳統服務器,以前叫GPU Server、AI服務器,現在又預裝大模型,被稱作AI一體機、大模型一體機。

      今年上半年涌現的各種一體機,基本都是這種情況。



      如果想要突破上面那種限制,插更多卡怎么辦呢?

      就必須要在卡間互聯方面整點黑科技↓

      用專門的Scale-Up網絡(高帶寬、低時延、強一致、內存語義、對等直出互聯,RoCE、IB都不行),把更多的卡連在一起,定制成一臺更大的“機器”。



      一般來說,16卡以上,基于Scale-Up網絡實現GPU-GPU互聯的系統,我們就可以稱之為超節點了。



      為什么需要超節點?

      先講一個事實:

      目前大模型的場景,沒有什么8卡機干不了的。如果一臺不夠,那就多臺組團(Scale-Out)干。

      比如,即便是遇到當下參數超大的模型,基于MoE架構,需要張量并行、專家并行……,單臺8卡/16卡機遭遇顯存墻扛不動。



      但仍然可以采用組團的方式,多臺機器基于IB或者RoCE網絡形成Scale-Out集群,把切割后的模型(張量并行、專家并行)分擔扛起來。



      但是,這種組團是有代價的,機器間的網絡互聯帶寬和延遲都無法與一臺機內部的連接相比。

      內循環和外循環的效率差距很大。



      這種帶寬和延遲的巨大差距,讓每個8卡機上的顯存、內存只能獨立作戰,無法形成跨節點、統一的顯存池、內存池。

      此時,遇到張量并行、專家并行這種跨卡通信開銷很大的場景,訓推效率就會打折扣。



      超節點就不一樣了,由于采用了專用的Scale-Up互聯標準(NVLink或其他開放標準比如UALink),天塹變通途了。

      超節點內所有的卡之間可以直接進行讀/寫/原子操作,從而形成更大的單體內存/顯存域,就好比組成了一個巨型顯卡,核心超多、顯存容量超大。



      這樣,超節點各GPU之間就可以進行高頻數據交換和控制命令交互,絲滑地像一張卡。

      面對超大參數的模型、復雜的張量并行或者專家并行策略,夸張的all-to-all、all-reduce通信開銷,更大的KV Cache壓力,超節點都可以輕松駕馭。



      超節點越大越好嗎?

      既然超節點這么牛掰,那就盡量往大里整唄?是不是單個節點越大越好呢?

      先說結論,單個超節點的規模并非越大越好,千萬不能這么整。





      小有小的缺點,大有大的劣勢,超節點太大,會帶來的以下弊端:

      ①成本:

      Scale-Up的網絡成本(比如NVSwitch或者其他新生代互聯技術),本身就高于Scale-Out的網絡成本(RoCE或者IB交換機)。

      而節點越大,卡間全互聯的線纜就越復雜,距離也會更大,線纜密度和距離會進一步增加成本,這種成本的增加不是線性的。



      ②故障率與爆炸半徑:

      單個節點規模越大,內部關鍵器件和連接就越多,潛在的故障點也會隨之增多,比如大規模的光互聯。

      故障風險也會隨之增大,而且為提高容錯性付出的成本也會更高。



      同時,單個節點的故障域也會變大,一旦發生故障,會波及更大范圍。





      ③可維護性與可交付性

      太大的超節點,高規格的定制機箱、散熱、供電、冗余設置,往往需要特殊的定制化,不僅增加了Capex成本,也大大增加了交付和運維的成本。

      甚至,傳統機房的空間、承重、制冷和供電,要經過一番傷筋動骨的改造,才能Hold得住大尺碼超節點。



      所以,超節點雖好,可不要貪大哦。

      如何尋求最佳平衡點

      超節點很好,但太大的超節點又有一堆麻煩事,到底多大合適呢?

      有一條鐵律↓

      超節點產品商業化落地的唯一考量,是每Token成本。

      提升算力利用率是建設AI Infra的關鍵,而不是盲目買個大家伙擺在家里鎮場子。



      前面我們說過,目前沒有什么場景是8卡機用Scale-Out方案搞不定的。

      但搞得定≠搞得好,因為我們需要用每Token成本來評估好壞。



      那些對節點間通信延遲敏感的場景,比如以DeepSeek為代表的大尺寸MoE模型,通信量大、時延要求苛刻。

      用超節點來跑,才有機會獲得最大化收益(每Token成本更低)。



      至于單個超節點多少卡合適?其實取決于主流模型的特點。

      在當下國內企業級本地部署場景,DeepSeek推理仍然是應用最廣泛的,MoE架構專家并行、P/D分離部署。

      需要綜合考慮互聯成本、通信開銷、互聯可靠性,再結合國產卡的性能最終得到一個甜點區。



      根據目前的工程經驗,在這類場景實際落地中,單節點32卡-64卡是一個相對不錯的選擇。

      比如,以典型的32卡超節點為例,32路專家并行,把大規模跨卡通信都壓縮在一個機框內。



      針對這樣的Case,新華三用自家超節點UniPod S80000,給出了實際實際落地參考,實戰效果相當不錯。



      確定了最佳的Scale-Up域,接下來,我們可以再根據實際需求,把多臺超節點,用RoCE網絡組成Scale-Out集群,滿足更大的并發和彈性需求。

      這種架構不僅能獲得最優的每Token成本,而且運維、部署簡單,具備極佳的可擴展性和準線性性能增長。



      當然,我們也應該看到,當前的大模型產品和技術正在以月甚至以周為單位高速迭代,今天的最優架構可能明天就落伍了。

      未來的主流模型是否還是Transformer架構,MoE會不會永遠適用,Scaling Law還能持續多久,一切都尚無定論。

      所以,8卡機與超節點之爭、小節點與大節點之戰,會長期存在,讓我們與時俱進、且戰且看吧。

      簡單給本文做個總結

      ①、超節點能干的大模型業務,普通8卡機(Scale-Out方案)都能干;

      ②、只有跨卡通信開銷大的場景,超節點跑起來才有優勢;

      ③、超節點落地的唯一標準是算力利用率和每Token成本,不要被情緒價值(高端、大氣、上檔次)左右了你的選擇。

      ④、超節點的Scale-UP域并非越大越好,“大”意味著更高的額外成本、更大的爆炸半徑、更復雜的運維和部署,以及產品鎖定風險。

      ⑤、基于目前國內企業級場景和模型生態,32-72卡超節點是相對最優落地選擇,更高算力利用率,并綜合考慮擴展性、可維護性、故障域、國產化因素。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      好萊塢女星吞槍自殺,吸毒成癮負債累累,20年沒拍戲靠撫養費生存

      好萊塢女星吞槍自殺,吸毒成癮負債累累,20年沒拍戲靠撫養費生存

      比利
      2025-12-27 13:11:35
      350億,又一家新勢力宣布破產

      350億,又一家新勢力宣布破產

      融資中國
      2025-12-26 12:27:57
      國安官宣巨變!54歲名宿李明離任,9年助隊奪2冠,德籍新老總接替

      國安官宣巨變!54歲名宿李明離任,9年助隊奪2冠,德籍新老總接替

      我愛英超
      2025-12-27 10:27:43
      71歲老人的睿智養老:不請保姆不去養老院,三個兒子都搶著來照顧

      71歲老人的睿智養老:不請保姆不去養老院,三個兒子都搶著來照顧

      人間百態大全
      2025-12-20 06:50:03
      被閨蜜和丈夫雙重背叛,女子“一夜白頭”!原配告第三者重婚案今日開庭

      被閨蜜和丈夫雙重背叛,女子“一夜白頭”!原配告第三者重婚案今日開庭

      環球網資訊
      2025-12-26 18:39:08
      “斬殺線”突然爆火:年薪45萬的硅谷程序員,咋半年就睡大街了?

      “斬殺線”突然爆火:年薪45萬的硅谷程序員,咋半年就睡大街了?

      大白聊IT
      2025-12-26 10:15:23
      賈磊:高詩巖防守CBA第一,貼身緊逼,只讓徐杰得到22分5板8助

      賈磊:高詩巖防守CBA第一,貼身緊逼,只讓徐杰得到22分5板8助

      體育哲人
      2025-12-27 00:01:22
      喜提獎金+汽車!張本智和對著100名日本人發誓:世乒賽還要拿冠軍

      喜提獎金+汽車!張本智和對著100名日本人發誓:世乒賽還要拿冠軍

      風過鄉
      2025-12-26 21:38:03
      脊背發涼!杭州一小區凌晨遭蒙面男掃樓式撬門

      脊背發涼!杭州一小區凌晨遭蒙面男掃樓式撬門

      東方豪俠
      2025-12-27 07:57:23
      徐湖平家掛兩幅“湖平如鏡”:一個是陳立夫寫的,一個是范增寫的

      徐湖平家掛兩幅“湖平如鏡”:一個是陳立夫寫的,一個是范增寫的

      漢史趣聞
      2025-12-25 10:41:03
      中國駐墨西哥使館:奉勸納瓦羅之流認真反思錯誤,停止自欺欺人的表演

      中國駐墨西哥使館:奉勸納瓦羅之流認真反思錯誤,停止自欺欺人的表演

      環球網資訊
      2025-12-27 06:43:19
      哭窮炫富,“知三當三”,裝了10年的吉克雋逸,還是“自食惡果”

      哭窮炫富,“知三當三”,裝了10年的吉克雋逸,還是“自食惡果”

      顧史
      2025-12-12 14:59:24
      A股公司,緊急報警:6000萬元買基金,9個月巨虧81%

      A股公司,緊急報警:6000萬元買基金,9個月巨虧81%

      每日經濟新聞
      2025-12-27 00:54:07
      廣東宏遠今日早報!徐杰最新傷情,朱芳雨深夜發聲,挖出最大水貨

      廣東宏遠今日早報!徐杰最新傷情,朱芳雨深夜發聲,挖出最大水貨

      多特體育說
      2025-12-27 07:40:03
      1962年雷鋒因公殉職,41年后調查人員揭露真相,令人淚目!

      1962年雷鋒因公殉職,41年后調查人員揭露真相,令人淚目!

      抽象派大師
      2025-12-22 01:46:01
      楊瀚森又遭雪藏,轉機將會是交易截止日?

      楊瀚森又遭雪藏,轉機將會是交易截止日?

      五星體育
      2025-12-27 16:49:15
      三連勝!大洛9記三分救快船?哈登+倫納德無奈:泰倫盧“臥底”?

      三連勝!大洛9記三分救快船?哈登+倫納德無奈:泰倫盧“臥底”?

      海棠侃球
      2025-12-27 14:36:46
      柬方:柬泰簽署協議,同意停火時間從當地時間27日中午12時開始

      柬方:柬泰簽署協議,同意?;饡r間從當地時間27日中午12時開始

      界面新聞
      2025-12-27 11:55:53
      烏軍收復波城180平方公里,澤連斯基將赴美與川普進行高風險博弈

      烏軍收復波城180平方公里,澤連斯基將赴美與川普進行高風險博弈

      史政先鋒
      2025-12-26 19:49:56
      緊急!多品牌洗發水暗含致癌物,趕緊自查你家洗漱臺有沒有!

      緊急!多品牌洗發水暗含致癌物,趕緊自查你家洗漱臺有沒有!

      今朝牛馬
      2025-12-26 17:16:28
      2025-12-27 17:12:49
      AI全球總部
      AI全球總部
      全球最新、最酷AI解決方案
      1099文章數 715關注度
      往期回顧 全部

      科技要聞

      小米也漲價了!業界稱終端再不漲明年必虧

      頭條要聞

      男子戒毒后隨領導出差被警察帶走驗尿 回家后工作沒了

      頭條要聞

      男子戒毒后隨領導出差被警察帶走驗尿 回家后工作沒了

      體育要聞

      NBA教練圈的布朗尼,花了22年證明自己

      娛樂要聞

      張昊唯逃稅涉黃風波落幕:法院認定朋友造謠

      財經要聞

      注意,開始拉物價了!

      汽車要聞

      好音響比大屏更重要?車企開始“聽”用戶的

      態度原創

      數碼
      親子
      健康
      旅游
      教育

      數碼要聞

      華為Mate 70 Air 16GB內存版今日開售 配麒麟9020A

      親子要聞

      父母為了孩子連夜驅車趕來武漢,為了方便換藥在武漢租房等待

      這些新療法,讓化療不再那么痛苦

      旅游要聞

      晴天的洱海,是一場對眼睛的‘蓄謀閃擊’

      教育要聞

      附加題難倒了學霸!陰影部分面積為90,求空白正方形的面積

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 欧美老熟妇又粗又大| 亚洲欧美中文字幕| ww污污污网站在线看com| 中文字幕日本六区小电影| 九九热色| 午夜在线不卡| 午夜成人无码福利免费视频| av人摸人人人澡人人超碰下载| 永寿县| 中文字幕人妻系列| 日日夜夜噜噜| 动漫AV纯肉无码AV电影网| 久久久久女教师免费一区| 国产精品毛片无遮挡高清| 亚洲国精产品一二二线| 元朗区| 久久精品熟妇丰满人妻99| 国产91特黄特色A级毛片| 日日躁夜夜躁狠狠久久av| 亚洲色另类| 熟女人妻AV| 人妻制服丝袜中文字幕| 不卡的AV在线| 国产一区二区三区内射高清| 91视频网站入口| 欧美视频二区欧美影视| 欧美性猛交xxxx免费看| 东北妇女精品bbwbbw| AVwww.333.rain.无码一区二区| 上林县| 国内A片| 91免费网站在线观看| 东北露脸91| 色色色资源| 中文字幕熟女人妻丝袜丝| 精品 无码 国产观看| 天天做天天爱夜夜爽女人爽| 欧美超大胆裸体xx视频| 被灌满精子的波多野结衣| 亚洲中文字幕乱码av波多ji| 人妻无码中文久久久久专区|