本文來(lái)源:時(shí)代周報(bào) 作者:唐洛
![]()
過(guò)去一年,國(guó)產(chǎn)化已成為人工智能領(lǐng)域的“必答題”。然而,真正的挑戰(zhàn)并不在于誰(shuí)喊得早,而在于能否解決一個(gè)更具現(xiàn)實(shí)意義的問(wèn)題:在模型規(guī)模持續(xù)膨脹、應(yīng)用深入真實(shí)業(yè)務(wù)場(chǎng)景的背景下,國(guó)產(chǎn)算力如何才能實(shí)現(xiàn)長(zhǎng)期、穩(wěn)定的運(yùn)行保障。
在當(dāng)前全球算力供應(yīng)鏈不確定性加劇的背景下,這一挑戰(zhàn)已遠(yuǎn)超技術(shù)路線之爭(zhēng),直接觸及人工智能產(chǎn)業(yè)能否持續(xù)穩(wěn)健擴(kuò)張的根本所在。
商湯科技給出的答案,顯得尤為克制和務(wù)實(shí)。在過(guò)去一年中,華為昇騰、寒武紀(jì)、沐曦等多家國(guó)產(chǎn)芯片,被同時(shí)納入商湯的AI體系。這并非簡(jiǎn)單的“點(diǎn)亮”兼容,而是深度集成至同一套AI基礎(chǔ)設(shè)施、同一套模型架構(gòu),以及同一條應(yīng)用交付鏈路之中。這背后,清晰地展現(xiàn)了商湯圍繞“大裝置—大模型—應(yīng)用”所構(gòu)建的三位一體戰(zhàn)略。
在這一戰(zhàn)略下,國(guó)產(chǎn)化不再是被動(dòng)應(yīng)對(duì)外部環(huán)境的權(quán)宜之計(jì),而是被拆解為一項(xiàng)長(zhǎng)期任務(wù):算力層面,要構(gòu)建多元、穩(wěn)定的國(guó)產(chǎn)算力供給;模型層面,要讓多模態(tài)大模型真正跑在不同國(guó)產(chǎn)芯片之上;應(yīng)用層面,則必須把算力能力轉(zhuǎn)化為客戶(hù)可用、可交付的產(chǎn)品。
當(dāng)華為昇騰、寒武紀(jì)、沐曦被同時(shí)接入,商湯真正關(guān)心的,或許并不是某一款芯片的上限,而是如何讓國(guó)產(chǎn)算力在真實(shí)業(yè)務(wù)中跑得久、跑得穩(wěn)。
助力國(guó)產(chǎn)算力從“可用”到“好用”
在大模型訓(xùn)練與推理場(chǎng)景中,算力瓶頸早已不只取決于單卡性能。異構(gòu)芯片之間的調(diào)度復(fù)雜度、跨域訓(xùn)練的穩(wěn)定性,正在成為影響整體算力效率的關(guān)鍵變量。
基于這一判斷,商湯突破口放在基礎(chǔ)設(shè)施層。作為商湯的 AI 云原生平臺(tái),商湯大裝置試圖解決的,正是異構(gòu)算力規(guī)模化使用中的系統(tǒng)性問(wèn)題。通過(guò)提供統(tǒng)一調(diào)度、彈性擴(kuò)展和高可靠性的 AI 基礎(chǔ)設(shè)施服務(wù),商湯大裝置希望以更高的性?xún)r(jià)比,推動(dòng)大模型能力在真實(shí)業(yè)務(wù)中的落地。
目前,寒武紀(jì)、壁仞、沐曦、華為昇騰、摩爾線程等多家國(guó)產(chǎn)芯片,已完成與商湯大裝置的深度適配,并支撐商湯“日日新”多模態(tài)大模型體系的訓(xùn)練與推理。這意味著,國(guó)產(chǎn) GPU 首次在千億參數(shù)級(jí)任務(wù)中,接受系統(tǒng)級(jí)、工業(yè)級(jí)的持續(xù)運(yùn)行檢驗(yàn)。
但真正的難點(diǎn),并不在“接入”本身。不同芯片在架構(gòu)設(shè)計(jì)、軟件棧上的差異,使統(tǒng)一訓(xùn)練與調(diào)度的復(fù)雜度顯著上升。
為此,上海AI實(shí)驗(yàn)室率先探索并研發(fā)了DeepLink超大規(guī)模跨域混訓(xùn)技術(shù)方案,通過(guò)訓(xùn)練加速、異構(gòu)通信、并行策略等核心技術(shù),打破芯片架構(gòu)差異帶來(lái)的協(xié)同壁壘,重構(gòu)計(jì)算資源調(diào)度體系。
而商湯大裝置發(fā)布基于DeepLink的異構(gòu)混合調(diào)度方案,將DeepLink深度融入商湯大裝置核心能力體系。通過(guò)這一方案,多種國(guó)產(chǎn)芯片之間可實(shí)現(xiàn)協(xié)同通信與統(tǒng)一調(diào)度,并自動(dòng)進(jìn)行并行策略?xún)?yōu)化和負(fù)載均衡,真正做到“不同芯片,同一平臺(tái)”的協(xié)同工作,釋放異構(gòu)集群的計(jì)算潛力。
在集群層面,商湯大裝置與華為昇騰384超節(jié)點(diǎn)率先完成全面適配。超節(jié)點(diǎn)(SuperPod)是一種通過(guò)高速互聯(lián)技術(shù),將多個(gè)GPU/NPU整合為統(tǒng)一計(jì)算單元的新型架構(gòu),解決AI大模型訓(xùn)練中的算力協(xié)同與通信效率問(wèn)題。圍繞昇騰384超節(jié)點(diǎn),商湯在調(diào)度優(yōu)化、跨 POD 訓(xùn)練穩(wěn)定性和多層級(jí)故障恢復(fù)方面進(jìn)行了針對(duì)性設(shè)計(jì),使多租戶(hù)、大規(guī)模、彈性AI云服務(wù)成為可能。
在推理環(huán)節(jié),商湯還與記憶張量合作,在國(guó)產(chǎn) GPGPU 上跑通了業(yè)內(nèi)首個(gè)以“記憶—計(jì)算—調(diào)度”一體化為核心的 PD 分離商用推理集群。在真實(shí) C 端負(fù)載下,該方案實(shí)現(xiàn)單卡并發(fā)效率提升20%、吞吐提升75%,綜合推理性?xún)r(jià)比達(dá)到英偉達(dá)A100的150%,為高性能模型的大規(guī)模落地打開(kāi)了新的降本增效空間。
此外,商湯聯(lián)合華為、庫(kù)帕思、海光、寒武紀(jì)、曦望 Sunrise、壁仞科技、麒麟軟件、摩爾線程等十余家國(guó)產(chǎn)廠商,共同發(fā)布“商湯大裝置算力 Mall”。這一平臺(tái)試圖構(gòu)建一個(gè)“算力超級(jí)市場(chǎng)”,讓開(kāi)發(fā)者和企業(yè)像選購(gòu)商品一樣,自由組合算力資源、平臺(tái)工具和行業(yè)模型服務(wù)。
在商湯科技看來(lái),“商湯大裝置算力 Mall”的價(jià)值不僅在于降低 AI 應(yīng)用門(mén)檻,更在于為用戶(hù)提供靈活、自主的國(guó)產(chǎn)算力選擇路徑,從系統(tǒng)層面削弱對(duì)單一海外技術(shù)體系的依賴(lài),推動(dòng)中國(guó) AI 產(chǎn)業(yè)向更加自主、可控的方向演進(jìn)。
低成本的視頻生成國(guó)產(chǎn)化生態(tài)
在多模態(tài)應(yīng)用中,視頻生成對(duì)算力的要求幾乎是一個(gè)極端場(chǎng)景。相比文本和圖像,視頻不僅引入了“時(shí)間”這一維度,使數(shù)據(jù)規(guī)模呈幾何級(jí)增長(zhǎng),還對(duì)連續(xù)性、物理一致性提出更高要求,模型必須在極短時(shí)間內(nèi)完成大量推理計(jì)算。這也使得視頻生成成為當(dāng)前所有 AI 模態(tài)中,算力消耗最高的領(lǐng)域。
今年,商湯開(kāi)源了支持實(shí)時(shí)視頻生成的推理框架 LightX2V,試圖解決的正是這一問(wèn)題。LightX2V 的設(shè)計(jì)目標(biāo)非常明確:把視頻生成從“實(shí)驗(yàn)室效果”拉進(jìn)可規(guī)模化部署的工程體系。
在具體實(shí)現(xiàn)上,LightX2V 通過(guò)步數(shù)蒸餾、低比特量化、稀疏注意力、特征緩存和張量卸載等一系列工程化手段,將顯存需求壓縮至 8GB 以下,使入門(mén)級(jí)消費(fèi)級(jí)顯卡也具備運(yùn)行條件;在速度上,框架支持最高 1:1的實(shí)時(shí)生成能力,即 5 秒視頻可在 5 秒內(nèi)完成生成。
在國(guó)產(chǎn)化適配上,LightX2V 設(shè)計(jì)了強(qiáng)兼容的國(guó)產(chǎn)化適配插件模式,可快速完成各類(lèi)國(guó)產(chǎn)硬件的適配,目前已支持寒武紀(jì)、沐曦、海光、昇騰等多款芯片。與此同時(shí),為更充分釋放國(guó)產(chǎn)算力特性,商湯在模型側(cè)同步調(diào)整,Seko 系列模型在設(shè)計(jì)階段就引入低比特量化、壓縮通信和稀疏注意力等硬件友好機(jī)制,使整體推理性能提升超過(guò) 3 倍。
據(jù)悉,適配完成后,商湯與寒武紀(jì)還將在算力利用率與成本效率、大規(guī)模并行處理能力等多個(gè)方向進(jìn)一步展開(kāi)深度優(yōu)化,進(jìn)一步降低多模態(tài)AI的使用門(mén)檻并提升整體體驗(yàn)。
由于在加速視頻創(chuàng)作上優(yōu)勢(shì)明顯,可實(shí)現(xiàn)極致性?xún)r(jià)比,截至目前,LightX2V 的累計(jì)下載量已超過(guò) 350 萬(wàn)次。這一數(shù)字不只是開(kāi)源項(xiàng)目的熱度指標(biāo),更反映出一個(gè)趨勢(shì):在視頻生成這一場(chǎng)景中,國(guó)產(chǎn)算力開(kāi)始擁有低成本的國(guó)產(chǎn)化生態(tài)。
國(guó)產(chǎn)化進(jìn)入產(chǎn)品與交付階段
相較于基礎(chǔ)設(shè)施和模型層面的技術(shù)驗(yàn)證,產(chǎn)品與項(xiàng)目交付更能檢驗(yàn)國(guó)產(chǎn)化的“含金量”。是否被持續(xù)使用、是否進(jìn)入業(yè)務(wù)核心流程,往往比單次跑通技術(shù)指標(biāo)更具說(shuō)服力。國(guó)產(chǎn)化能否成立,最終要看它能否在真實(shí)場(chǎng)景中替代、并長(zhǎng)期運(yùn)轉(zhuǎn)。
在應(yīng)用層,商湯將這一判斷率先落在生成式內(nèi)容生產(chǎn)上。12 月15日,商湯科技基于其在生成式 AI 與多模態(tài)交互領(lǐng)域的積累,發(fā)布 Seko 2.0——行業(yè)首個(gè)面向多劇集生成的智能體。在長(zhǎng)視頻生成場(chǎng)景中,角色一致性、畫(huà)面風(fēng)格穩(wěn)定性始終是制約規(guī)模化生產(chǎn)的核心難題,而Seko 2.0在多劇集視頻生成的一致性方面展現(xiàn)出顯著優(yōu)勢(shì),其背后依托的是商湯自研的日日新Seko系列模型,包括SekoIDX、SekoTalk等圖像與視頻生成多模態(tài)模型所構(gòu)建的技術(shù)底座。
更重要的是,這套能力已完成在國(guó)產(chǎn)算力上的適配。商湯日日新 Seko 系列模型已支持寒武紀(jì)等國(guó)產(chǎn) AI 芯片,在 AIGC 核心場(chǎng)景中實(shí)現(xiàn)了從語(yǔ)言模型到多模態(tài)生成的關(guān)鍵跨越。這不僅是技術(shù)協(xié)同的深化,更是國(guó)產(chǎn)AI生態(tài)的重要完善,為視覺(jué)內(nèi)容的創(chuàng)新開(kāi)發(fā)提供了更堅(jiān)實(shí)、自主的底層支撐。
在終端側(cè),商湯旗下 AI 智能助手“小浣熊”已完成多種國(guó)產(chǎn)芯片的適配,并針對(duì)個(gè)人 PC 使用場(chǎng)景進(jìn)行專(zhuān)項(xiàng)優(yōu)化。在端側(cè)運(yùn)行條件下,其模型精度與云端保持一致。同時(shí),小浣熊也已適配多種國(guó)產(chǎn)芯片一體機(jī)方案,形成軟硬件協(xié)同的全國(guó)產(chǎn)化部署路徑,為對(duì)數(shù)據(jù)安全和自主可控要求較高的用戶(hù)提供現(xiàn)實(shí)選擇。
此外,在計(jì)算機(jī)視覺(jué)、金融、醫(yī)療以及“大裝置”等私有化業(yè)務(wù)中,商湯也已完成國(guó)產(chǎn)芯片的適配與交付。在外部環(huán)境不確定性加大的背景下,企業(yè)選擇國(guó)產(chǎn)算力并非單一動(dòng)因,合規(guī)要求、供應(yīng)鏈穩(wěn)定性以及長(zhǎng)期成本結(jié)構(gòu)共同構(gòu)成決策邏輯。而能否在產(chǎn)品與交付階段順利落地,正是國(guó)產(chǎn)算力跨越這一門(mén)檻的關(guān)鍵。
從大裝置、大模型到應(yīng)用層,商湯與多家國(guó)產(chǎn) AI 芯片企業(yè)展開(kāi)深度合作,在實(shí)際項(xiàng)目中磨合能力邊界,形成“技術(shù)互補(bǔ)、資源共享、場(chǎng)景互哺”的協(xié)同模式。這種以交付為牽引的合作路徑,不僅推動(dòng)了國(guó)產(chǎn)算力的可用性提升,也在一定程度上緩解了市場(chǎng)對(duì)供應(yīng)鏈不確定性的擔(dān)憂。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.