<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      國(guó)產(chǎn)推理GPU問(wèn)世!首用LPDDR6,性價(jià)比飆10倍

      0
      分享至


      芯東西(公眾號(hào):aichip001)
      作者 ZeR0
      編輯 漠影

      芯東西1月28日?qǐng)?bào)道,1月27日,浙江杭州GPU創(chuàng)企曦望(Sunrise)披露未來(lái)三年產(chǎn)品路線圖,發(fā)布新一代推理GPU芯片啟望S3,并推出面向大模型推理的寰望SC3超節(jié)點(diǎn)方案推理云計(jì)劃

      啟望S3支持從FP16FP4的多精度靈活切換,是國(guó)內(nèi)首款采用LPDDR6顯存方案的GPGPU芯片,號(hào)稱取得了相比上一代“10倍以上”的推理性價(jià)比提升。

      根據(jù)曦望“量產(chǎn)一代、發(fā)布一代、預(yù)研一代”的節(jié)奏規(guī)劃,高性價(jià)比推理GPU芯片啟望S3今年上市,高性能推理GPU芯片啟望S4將于2027年上市,安全可控推理GPU芯片啟望S5將于2028年上市。


      過(guò)去8年,曦望研發(fā)投入累計(jì)達(dá)20億元,成功量產(chǎn)了S1和S2,今天發(fā)布S3,目標(biāo)將中國(guó)的推理成本拉到“百萬(wàn)token一分錢”的新水平。


      除了啟望S3芯片及超節(jié)點(diǎn)產(chǎn)品之外,S3的產(chǎn)品矩陣還包括智望系列PCIe計(jì)算卡和OAM計(jì)算模塊、辰望系列PCIe服務(wù)器以及OAM服務(wù)器、寰望系列AI計(jì)算集群、熙望系列AI PC或AI液冷工作站。


      一、脫胎商湯大芯片部門,IP授權(quán)索尼小米,去年完成約30億元戰(zhàn)略融資

      曦望成立于2020年5月,前身是商湯科技大芯片部門,團(tuán)隊(duì)超過(guò)300人,主要來(lái)自英偉達(dá)、AMD、昆侖芯、商湯等企業(yè),核心技術(shù)骨干平均有15年的行業(yè)經(jīng)驗(yàn)。

      “我們是一家更懂AI的GPU芯片公司,而且是國(guó)內(nèi)第一家All in推理的GPU芯片公司?!标赝麻L(zhǎng)徐冰說(shuō)。

      曦望的使命是把大模型推理做到極致,要讓AI推理真正變得便宜穩(wěn)定,而且隨處可用。

      負(fù)責(zé)研發(fā)的曦望聯(lián)席CEO王勇,是前AMD、昆侖芯的核心架構(gòu)師,有20年芯片研發(fā)經(jīng)驗(yàn)。2020年加入商湯后,他帶領(lǐng)百人團(tuán)隊(duì)主導(dǎo)了曦望兩代芯片的研發(fā)和量產(chǎn),均實(shí)現(xiàn)一次性成功點(diǎn)亮。

      另一位聯(lián)席CEO王湛,是百度創(chuàng)始團(tuán)隊(duì)成員、原集團(tuán)副總裁,曾帶領(lǐng)百度搜索8000人團(tuán)隊(duì),有豐富的產(chǎn)品化經(jīng)驗(yàn)及商業(yè)化的操盤經(jīng)驗(yàn),2025年初加入了曦望,負(fù)責(zé)產(chǎn)品化及商業(yè)化,同時(shí)牽頭打造更有戰(zhàn)斗力的組織文化。


      過(guò)去一年,曦望累計(jì)完成了約30億元戰(zhàn)略融資,股東既有商湯、三一、杭州數(shù)據(jù)集團(tuán)、范式、正大等行業(yè)龍頭,又有多家國(guó)資平臺(tái)及頂尖風(fēng)投機(jī)構(gòu)。

      2025年,曦望推理GPU芯片交付量已突破1萬(wàn)片,收入大幅增長(zhǎng),拿下多個(gè)頭部客戶的訂單。


      “我們拒絕做跑分黨,不希望用benchmark來(lái)定義芯片,而是希望能夠做到幫客戶賺錢的算力?!蓖跤抡f(shuō)。

      王勇談道,曦望擁有全棧資源的GPGPU架構(gòu),覆蓋從自研指令集、GPGPU IP、SoC到硬件系統(tǒng),更早提出了用大容量DDR來(lái)替代HBM、用高性價(jià)比的大模型推理芯片來(lái)替代訓(xùn)推一體芯片的概念,在戰(zhàn)略上率先All in推理GPU市場(chǎng)。

      其團(tuán)隊(duì)從2018年開始研發(fā)第一代啟望S1視覺(jué)推理芯片,2020年實(shí)現(xiàn)上萬(wàn)片量產(chǎn)。S1已實(shí)現(xiàn)IP授權(quán)給索尼小米,分別用在索尼AI攝像頭及小米手機(jī)上。


      2020年,曦望開始打造高性能GPGPU芯片啟望S2,對(duì)標(biāo)當(dāng)時(shí)的國(guó)際巨頭旗艦GPU。S2在2021年流片,在2023年實(shí)現(xiàn)產(chǎn)品化,在DeepSeek滿血版適配上達(dá)到了國(guó)際巨頭80%的推理性能,在國(guó)內(nèi)處于第一梯隊(duì)。


      同時(shí),曦望在軟件棧上做到了95%的CUDA兼容,基本上能做到客戶的推理業(yè)務(wù)無(wú)縫遷移。

      據(jù)王勇透露,曦望已積累很多典型客戶,比如適配了商湯全系列小浣熊模型,與中國(guó)電子旗下長(zhǎng)城集團(tuán)一起打造了基于國(guó)產(chǎn)CPU+GPU的國(guó)產(chǎn)信創(chuàng)一體機(jī),與范式、星凡星啟、玄武智能一起拓展更多的GPU垂直應(yīng)用等。


      二、啟望S3:支持FP4、采用LPDDR6,單位token推理成本減少90%

      徐冰說(shuō),為實(shí)現(xiàn)極致的成本效益,曦望拋棄了傳統(tǒng)訓(xùn)推一體GPU為訓(xùn)練準(zhǔn)備的冗余設(shè)計(jì),不追求峰值TFLOPS這種紙面數(shù)據(jù),把真實(shí)業(yè)務(wù)場(chǎng)景中每個(gè)token的成本、能耗以及SLA穩(wěn)定性作為所有設(shè)計(jì)決策的根本出發(fā)點(diǎn)。

      他強(qiáng)調(diào),這三大指標(biāo)直接決定了最終的業(yè)務(wù)毛利率,直接影響了終端客戶群體的用戶體驗(yàn)。

      據(jù)王勇分享,曦望S3針對(duì)大模型做了極致的性能優(yōu)化,取得了10倍以上的推理性價(jià)比提升,力爭(zhēng)在這一代產(chǎn)品的整個(gè)生命周期里形成百億級(jí)收入。

      S3是一款面向大模型推理深度定制的GPGPU芯片。其單芯片推理性能提升5倍,支持從FP16FP8FP6FP4等多精度靈活切換,釋放低精度推理效率,這種設(shè)計(jì)更貼合當(dāng)前MoE和長(zhǎng)上下文模型在推理階段的需求。


      其核心研發(fā)特點(diǎn)包括:

      1、追求極致PPA。在架構(gòu)上,揚(yáng)棄了一些訓(xùn)練相關(guān)的貴重組件,采用了一些較新的、針對(duì)推理極致優(yōu)化的架構(gòu)和技術(shù)組件;在IP上,跟進(jìn)最新GPU IP架構(gòu),選用國(guó)際巨頭最先進(jìn)的第三方高速接口IP。

      2、采用目前合規(guī)的、最先進(jìn)的國(guó)際工藝節(jié)點(diǎn)。

      3、國(guó)內(nèi)首款采用LPDDR6的GPGPU推理芯片。曦望團(tuán)隊(duì)做了很多架構(gòu)研究,發(fā)現(xiàn)LPDDR6才是當(dāng)前推理的最優(yōu)解,相比LPDDR5帶寬提升1倍以上、容量大幅提升,致使啟望S3顯存容量較上一代訓(xùn)推一體芯片提升4倍。


      除了算力和訪存之外,曦望研究了大模型的本身特點(diǎn),發(fā)現(xiàn)大模型有一個(gè)黃金的算力訪存比,并在啟望S3上遵循這一原則,達(dá)到算力訪存比的“甜點(diǎn)”,不浪費(fèi)一分算力和帶寬。

      在DeepSeek V3/R1滿血版等主流大模型推理場(chǎng)景中,S3的單位token推理成本較上一代產(chǎn)品下降約90%。

      三、寰宇SC3超節(jié)點(diǎn)方案:全液冷、256卡互聯(lián),支持模塊化交付

      圍繞S3,曦望同步發(fā)布了面向大模型推理的寰望SC3超節(jié)點(diǎn)解決方案,同樣追求極致性價(jià)比。

      寰望SC3從一開始即面向千億、萬(wàn)億級(jí)參數(shù)多模態(tài)MoE推理的真實(shí)部署需求進(jìn)行設(shè)計(jì),支持單域256卡一級(jí)互聯(lián),可高效支撐PD分離架構(gòu)與大EP(Expert Parallelism)規(guī)模化部署,顯著提升推理階段的系統(tǒng)利用率與穩(wěn)定性,適配長(zhǎng)上下文、多并發(fā)、多專家并行等復(fù)雜推理場(chǎng)景。

      交付形態(tài)上,寰望SC3采用全液冷設(shè)計(jì),具備極致PUE表現(xiàn),支持模塊化交付與快速部署。

      在大EP部署的情況下,其吞吐率相比非大EP部署可提高20~25倍,能取得非常好的推理效果。

      王勇稱,在同等推理能力量級(jí)下,該方案可將整體系統(tǒng)交付成本從行業(yè)常見(jiàn)的億元級(jí)降低至千萬(wàn)元級(jí),實(shí)現(xiàn)1個(gè)數(shù)量級(jí)的下降

      曦望也在卡間互聯(lián)上做了較多工作,可做到16到256卡的超節(jié)點(diǎn)產(chǎn)品,將多個(gè)超節(jié)點(diǎn)通過(guò)直出的RDMA連接時(shí),還能構(gòu)建千卡甚至幾千卡的互聯(lián)集群。

      軟件方面,曦望構(gòu)建了與CUDA兼容的基礎(chǔ)軟件體系,覆蓋驅(qū)動(dòng)、運(yùn)行時(shí)API、開發(fā)工具鏈、算子庫(kù)和通信庫(kù),降低推理應(yīng)用的遷移門檻。


      該體系適配DeepSeek、通義千問(wèn)、商湯日日新、騰訊混元3D等國(guó)內(nèi)外百余種大模型,已適配ModelScope平臺(tái)90%以上主流大模型形態(tài)。


      四、推理云平臺(tái):與合作伙伴共建,邁向“百萬(wàn)token一分錢”

      曦望圍繞芯片+系統(tǒng)+生態(tài)來(lái)做整體布局,一方面提供推理GPU卡標(biāo)準(zhǔn)的一體化的服務(wù)器,整機(jī)、集群方案,另一方面與商湯、范式等AI龍頭,以及各類算力廠商和芯片廠商深度合作,打造推理加速專區(qū),讓推理服務(wù)可以長(zhǎng)期、穩(wěn)定、可持續(xù)。

      現(xiàn)場(chǎng),曦望與商湯、范式宣布啟動(dòng)共建“百萬(wàn)Token一分錢”合作,并與杭鋼數(shù)字科技、浙江算力科技等本地算力平臺(tái)聯(lián)手,將推理基礎(chǔ)設(shè)施鋪到浙江,輻射全國(guó)。


      與此同時(shí),曦望與三一、協(xié)鑫、游族等十幾家生態(tài)伙伴集中簽約,曦望把極致推理真正嵌入到制造、能源、C端、機(jī)器人等具體場(chǎng)景。


      后續(xù),曦望還計(jì)劃開啟推理即服務(wù)的新模式。

      曦望聯(lián)席CEO王湛談道,基于自研GPU和全棧優(yōu)化,曦望打造了新一代AI原生智算平臺(tái)

      (1)軟硬件深度協(xié)同:曦望GPU內(nèi)核、通信庫(kù)都是自研的,所以軟硬件協(xié)同能實(shí)現(xiàn)物理級(jí)優(yōu)化,可實(shí)現(xiàn)從底層芯片到上層平臺(tái)的全棧優(yōu)化。

      曦望采用量化壓縮技術(shù),使其既保持高精度算力的質(zhì)量,又能夠利用到低精度算力的效能,在實(shí)測(cè)中,精度損失極小,性能提升250%以上。


      (2)資源極致彈性:通過(guò)云化的方式,采用GPU池化、動(dòng)態(tài)擴(kuò)縮容、智能負(fù)載預(yù)測(cè)等技術(shù),實(shí)現(xiàn)算力資源的池化與按需供給。

      (3)開箱即用:提供集成的模型市場(chǎng)開發(fā)工具,大幅降低技術(shù)門檻。

      (4)穩(wěn)定可靠:平臺(tái)由專業(yè)人員維護(hù),提供大量工具,具備高可用、安全隔離和智能運(yùn)維的能力,有狀態(tài)遙測(cè)、健康度分析、自動(dòng)部署、故障快速隔離4大特點(diǎn)。


      基于該平臺(tái),曦望商業(yè)模式進(jìn)一步升級(jí),將與合作伙伴共建推理云平臺(tái),形成芯片和生態(tài)共建的雙輪驅(qū)動(dòng),使客戶能夠享有一體化、高效益、零門檻的算力服務(wù)。

      通過(guò)GPU池化與彈性調(diào)度,曦望將底層算力整合為統(tǒng)一的推理算力池,并以MaaS(Model as a Service)作為核心入口,使企業(yè)無(wú)需關(guān)注底層硬件配置與集群運(yùn)維,即可按需調(diào)用大模型推理能力。

      這一體系也成為“百萬(wàn)Token一分錢”推理成本合作的重要技術(shù)基礎(chǔ)。

      在圓桌對(duì)話環(huán)節(jié),王勇補(bǔ)充說(shuō),曦望設(shè)定的“百萬(wàn)token一分錢”目標(biāo),將會(huì)在S3、S4及S5階段中逐步達(dá)成。

      另?yè)?jù)煒燁智算董事長(zhǎng)兼CEO周韡韡分享,煒燁智算參與了曦望與中交的藍(lán)翼大模型的適配工作,經(jīng)測(cè)算,目前曦望每百萬(wàn)token的價(jià)格約為人民幣0.57元,已經(jīng)非常有競(jìng)爭(zhēng)力,相比之下市場(chǎng)上現(xiàn)有算力價(jià)格通常在人民幣7~14元之間。

      綜上,曦望致力于提供高性價(jià)比、極致能效的綠色算力,其商業(yè)模式是芯片硬實(shí)力+云基建軟實(shí)力,形成“token as a service”,既提供公共的token服務(wù),又提供定制化的token服務(wù),還有混合token服務(wù),以滿足不同客戶需求。

      結(jié)語(yǔ):讓算力用得上、用得好、用得起

      會(huì)上,中國(guó)工程院院士、浙江大學(xué)信息學(xué)部主任吳漢明分享說(shuō),推理算力價(jià)值的實(shí)現(xiàn)離不開協(xié)同,需要芯片設(shè)計(jì)、系統(tǒng)集成、軟件開發(fā)到產(chǎn)業(yè)應(yīng)用的全鏈條協(xié)作。

      徐冰認(rèn)為,推理的戰(zhàn)略價(jià)值,決定的是國(guó)家和企業(yè)在AI下半場(chǎng)的競(jìng)爭(zhēng)力,誰(shuí)掌握高效、可控、可持續(xù)的推理基礎(chǔ)設(shè)施,誰(shuí)就能主導(dǎo)AI的落地速度。

      他談道,曦望致力于做好三件事:讓算力更便宜,讓部署更簡(jiǎn)單,讓生態(tài)更開放。在推理時(shí)代,曦望要做讓算力變得便宜、穩(wěn)定、隨處可用的核心底座。

      “我們堅(jiān)信,隨著AI推理紅利全面釋放,曦望一定能走出一條中國(guó)企業(yè)自主發(fā)展推理GPU的特色之路,真正實(shí)現(xiàn)國(guó)產(chǎn)AI芯片從跟跑到差異化領(lǐng)跑的關(guān)鍵跨越?!毙毂f(shuō)。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      大戰(zhàn)可能馬上開始了

      大戰(zhàn)可能馬上開始了

      安安說(shuō)
      2026-02-25 10:11:39
      女子故意扮丑去相親,男子一眼看中,女子吃驚:他是不是太餓了

      女子故意扮丑去相親,男子一眼看中,女子吃驚:他是不是太餓了

      丫頭舫
      2026-02-10 22:18:05
      山東巨人徐富海去世,身高2.4米,患十多種疾病,母親拉著他要飯

      山東巨人徐富海去世,身高2.4米,患十多種疾病,母親拉著他要飯

      寒士之言本尊
      2026-02-20 23:19:47
      葡媒稱普雷斯蒂安尼向隊(duì)友承認(rèn)使用種族歧視用詞,本菲卡官方隨即否認(rèn)

      葡媒稱普雷斯蒂安尼向隊(duì)友承認(rèn)使用種族歧視用詞,本菲卡官方隨即否認(rèn)

      懂球帝
      2026-02-27 03:47:21
      喜訊 又一王牌外援滿足歸化條件 125場(chǎng)造71球 國(guó)足喜添中場(chǎng)指揮官

      喜訊 又一王牌外援滿足歸化條件 125場(chǎng)造71球 國(guó)足喜添中場(chǎng)指揮官

      零度眼看球
      2026-02-27 07:01:05
      西城婦幼醫(yī)院門口“云霧繚繞”,孩子在煙霧中穿行…這煙非吸不可?

      西城婦幼醫(yī)院門口“云霧繚繞”,孩子在煙霧中穿行…這煙非吸不可?

      家住東西城
      2026-02-26 20:34:36
      俄羅斯四大目標(biāo)全落空,失遠(yuǎn)大于得,國(guó)運(yùn)被徹底透支

      俄羅斯四大目標(biāo)全落空,失遠(yuǎn)大于得,國(guó)運(yùn)被徹底透支

      咣當(dāng)?shù)厍?/span>
      2026-02-26 14:45:43
      中科院將停止支付《自然-通訊》《細(xì)胞報(bào)告》等 30 種期刊的發(fā)表費(fèi)

      中科院將停止支付《自然-通訊》《細(xì)胞報(bào)告》等 30 種期刊的發(fā)表費(fèi)

      TOP大學(xué)來(lái)了
      2026-02-25 16:32:26
      英偉達(dá)跌幅擴(kuò)大至5%

      英偉達(dá)跌幅擴(kuò)大至5%

      界面新聞
      2026-02-26 23:28:26
      不賺最后一個(gè)銅板!李嘉誠(chéng)長(zhǎng)和系出售英國(guó)電網(wǎng)業(yè)務(wù)100%股權(quán),僅賣1100億港元?

      不賺最后一個(gè)銅板!李嘉誠(chéng)長(zhǎng)和系出售英國(guó)電網(wǎng)業(yè)務(wù)100%股權(quán),僅賣1100億港元?

      新浪財(cái)經(jīng)
      2026-02-26 19:55:50
      被裁獲賠380萬(wàn),我騙同事只拿N+1,次日26名技術(shù)員集體辭職!

      被裁獲賠380萬(wàn),我騙同事只拿N+1,次日26名技術(shù)員集體辭職!

      奶茶麥子
      2026-02-26 12:34:08
      趴在中國(guó)仁愛(ài)礁9000多天的菲律賓軍艦,如今已經(jīng)再也拖不走了

      趴在中國(guó)仁愛(ài)礁9000多天的菲律賓軍艦,如今已經(jīng)再也拖不走了

      小小科普員
      2025-11-21 20:23:24
      大連功勛門將,見(jiàn)證萬(wàn)達(dá)巔峰,退役后賣海參,55歲滿頭白發(fā)認(rèn)不出

      大連功勛門將,見(jiàn)證萬(wàn)達(dá)巔峰,退役后賣海參,55歲滿頭白發(fā)認(rèn)不出

      滄海旅行家
      2026-02-25 19:05:55
      臨近年關(guān),王寶強(qiáng)又官宣新喜訊,離婚9年成功讓馬蓉再也高攀不起

      臨近年關(guān),王寶強(qiáng)又官宣新喜訊,離婚9年成功讓馬蓉再也高攀不起

      翰飛觀事
      2026-02-27 00:06:02
      特朗普還沒(méi)來(lái)中國(guó),美高官攤牌:從不相信中國(guó),訪華只有1個(gè)目的

      特朗普還沒(méi)來(lái)中國(guó),美高官攤牌:從不相信中國(guó),訪華只有1個(gè)目的

      東極妙嚴(yán)
      2026-02-26 15:59:06
      美媒解讀東契奇拒投絕殺后唇語(yǔ):詹姆斯讓我傳球,我就傳了

      美媒解讀東契奇拒投絕殺后唇語(yǔ):詹姆斯讓我傳球,我就傳了

      懂球帝
      2026-02-26 09:45:10
      國(guó)米將為沖擊雙冠王而輪換 意甲第八年薪的教練加雞腿在即

      國(guó)米將為沖擊雙冠王而輪換 意甲第八年薪的教練加雞腿在即

      國(guó)際足球冷雪
      2026-02-27 07:13:05
      身中4彈不松手!為抓捕馬杜羅他駕重傷直升機(jī)完成絕密突襲

      身中4彈不松手!為抓捕馬杜羅他駕重傷直升機(jī)完成絕密突襲

      老馬拉車莫少裝
      2026-02-26 14:56:46
      歐聯(lián)杯16強(qiáng)出爐,1/8決賽抽簽將于2月27日20時(shí)進(jìn)行

      歐聯(lián)杯16強(qiáng)出爐,1/8決賽抽簽將于2月27日20時(shí)進(jìn)行

      懂球帝
      2026-02-27 06:57:13
      打臉了?2015年專家預(yù)測(cè):一旦開放二胎,中國(guó)新生人口將會(huì)激增

      打臉了?2015年專家預(yù)測(cè):一旦開放二胎,中國(guó)新生人口將會(huì)激增

      知鑒明史
      2025-10-04 18:55:52
      2026-02-27 08:40:49
      芯東西 incentive-icons
      芯東西
      專注AI芯片、半導(dǎo)體產(chǎn)業(yè)媒體
      2211文章數(shù) 8150關(guān)注度
      往期回顧 全部

      科技要聞

      英偉達(dá)業(yè)績(jī)亮眼仍跌5% 兩大因素成核心隱憂

      頭條要聞

      牛彈琴:中國(guó)的兩個(gè)鄰國(guó)大打出手 傷亡相當(dāng)慘重

      頭條要聞

      牛彈琴:中國(guó)的兩個(gè)鄰國(guó)大打出手 傷亡相當(dāng)慘重

      體育要聞

      從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

      娛樂(lè)要聞

      向華強(qiáng)公開表態(tài) 財(cái)產(chǎn)留給兒媳婦郭碧婷

      財(cái)經(jīng)要聞

      魅族手機(jī),終成棄子?

      汽車要聞

      40歲的吉利,不惑于內(nèi)外

      態(tài)度原創(chuàng)

      游戲
      本地
      教育
      家居
      公開課

      Steam Deck滿四歲!繼任機(jī)型依然杳無(wú)音信

      本地新聞

      津南好·四時(shí)總相宜

      教育要聞

      圓內(nèi)接四邊形第2講,一個(gè)視頻學(xué)會(huì)!

      家居要聞

      歸隱于都市 慢享自由

      公開課

      李玫瑾:為什么性格比能力更重要?

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版