2026年,全球人工智能領(lǐng)域迎來新一輪技術(shù)爆發(fā)潮。在這場激烈的技術(shù)競賽中,北京企業(yè)展現(xiàn)出強勁實力,在全球掀起“驚濤駭浪”。
1月8日,智譜AI在香港交易所掛牌上市,成為“全球大模型第一股”,此后發(fā)布的智譜GLM-5在全球權(quán)威榜單中位居全球第四、開源模型第一。2月7日,字節(jié)推出的視頻生成模型Seedance 2.0全球“出圈”,令好萊塢導(dǎo)演驚嘆,讓海外網(wǎng)友在社交平臺“催上線”。Kimi、生數(shù)科技、面壁智能、銀河通用等企業(yè)也相繼推出新一代大模型產(chǎn)品,在通用大語言模型、多模態(tài)視頻生成、代碼編程、具身智能等核心賽道實現(xiàn)全面突破。
北京,這座千年古都,正在以驚人的速度蛻變?yōu)槿駻I創(chuàng)新的策源地。
從“會寫代碼”到“能完成工程”
過去兩年,大模型在代碼生成能力方面的進展業(yè)界有目共睹。但寫代碼和完成工程系統(tǒng)之間,始終橫亙著一道鴻溝。這道鴻溝,正在被北京的企業(yè)們用實實在在的技術(shù)突破填平。GLM-5的發(fā)布,標(biāo)志著國產(chǎn)大模型完成了從“初級程序員”到“總架構(gòu)師”的進化。
GLM-5采用了744B總參數(shù)、40B激活參數(shù)的MoE架構(gòu),引入DeepSeek稀疏注意力機制(DSA),部署成本降低30%以上。在Vending Bench 2測試中,GLM-5需要完全自主地經(jīng)營一年的售貨機業(yè)務(wù),最終實現(xiàn)了4432美元的賬戶余額,這一表現(xiàn)已經(jīng)非常接近頂級的閉源模型。
一個更具說服力的案例是,B站知名游戲博主、獨立游戲開發(fā)者“夜神不說話”利用GLM-5,在12小時內(nèi)開發(fā)出一款名為《逃離千禧年》的游戲,完成了傳統(tǒng)開發(fā)模式下需要2~3個月才能完成的工作量。
開發(fā)者通過GLM-5調(diào)用多Agent同步并發(fā)架構(gòu),一人分飾多角,GLM-5不僅在短短20分鐘內(nèi)生成了包含1275行代碼的復(fù)雜背包系統(tǒng),且邏輯閉環(huán)無幻覺,還協(xié)助完成了美術(shù)素材的Python自動化處理腳本及音樂風(fēng)格設(shè)計文檔的生成。
這不是炫技,而是真正的生產(chǎn)力革命。
實際上,早在GLM-5正式發(fā)布之前,其測試版本“Pony Alpha”便已在海外開發(fā)者社區(qū)引起轟動。這個神秘模型在完全無人干預(yù)下,能自主修復(fù)代碼、讀取日志,耗時數(shù)天構(gòu)建出一個可用的C語言編譯器;甚至有人用它從零開發(fā)了手機應(yīng)用,直接打包上架了應(yīng)用商店。
2月11日深夜,謎底揭曉。被硅谷追捧的神秘模型“Pony Alpha”就是中國AI公司智譜發(fā)布并開源的旗艦?zāi)P虶LM-5。海內(nèi)外對GLM-5的贊譽不僅表現(xiàn)在熱度上,同時也被迅速轉(zhuǎn)化成了購買欲。智譜官方每天限額的GLM Coding Plan即使?jié)q價30%也是秒空,沒能上車的開發(fā)者也只能每天蹲點搶,甚至就連Ollama的云服務(wù)也在上線GLM-5之后被擠爆。
這說明,市場愿意為真正的技術(shù)突破買單。
從“單兵作戰(zhàn)”到“集群協(xié)作”
處理真實世界的復(fù)雜難題不能只靠單打獨斗,還需要更多團隊協(xié)作。這正是月之暗面Kimi K2.5的核心突破所在。
Kimi K2.5的更新中,研發(fā)團隊重構(gòu)了強化學(xué)習(xí)基建,通過優(yōu)化訓(xùn)練算法進行全新探索,推出Agent集群,讓Agent從單兵突破進化成集群式作戰(zhàn)。執(zhí)行復(fù)雜任務(wù)時,K2.5不再是單一的“全能專家”,而是化身為一支即時組建的專業(yè)團隊。它能根據(jù)任務(wù)需求,現(xiàn)場調(diào)度多達(dá)100個不同專業(yè)背景的“分身”,并行處理1500個步驟,所有的角色分配與任務(wù)拆解無需預(yù)設(shè),全由K2.5即時決策。這不是簡單的并行計算,而是智能化的任務(wù)分解與協(xié)同。
借助Agent集群,用戶可以讓一群“分析師”分頭完成100家公司的市場調(diào)研,動員“語言專家團”翻譯300頁文檔,還能派出不同的“研究員”綜述5篇跨專業(yè)的論文,讓效率提升十倍以上。
更重要的是,Kimi K2.5的Agent能力也全面擴展至辦公場景。通過對Word、Excel、PPT、PDF等常用辦公軟件的深度學(xué)習(xí),用戶只需通過自然語言下達(dá)簡單指令,即可成為快速精通辦公軟件的專業(yè)用戶,并實現(xiàn)不同格式間的自由轉(zhuǎn)換。
這種能力的突破,意味著AI正在從“工具”進化為“伙伴”,從“助手”升級為“協(xié)作者”。
在全球范圍內(nèi),Kimi K2.5的表現(xiàn)同樣令人矚目。在HLE-Full w/ tools基準(zhǔn)測試中,Kimi K2.5以50.2%的得分登頂,比GPT-5.2高出4.7個百分點,比Claude 4.5 Opus高出7個百分點。這個差距在高難度測試中堪稱“碾壓級”。
這是開源AI首次在高難度工具任務(wù)上正面擊敗閉源頭部模型,具有里程碑意義。
從“內(nèi)容生成”到“電影級生產(chǎn)”
如果說代碼生成和智能體協(xié)作還是“數(shù)字世界”的事,那么視頻生成技術(shù)的突破,則正在徹底改變“內(nèi)容生產(chǎn)”這個萬億級市場。
進入2026年,AI大模型正加速邁過從“炫酷玩具”到“可靠生產(chǎn)力工具”的臨界點。Seedance 2.0提升了視頻生成的穩(wěn)定性與可控性,使模型從“創(chuàng)意工具”轉(zhuǎn)向“生產(chǎn)工具”,標(biāo)志著AI視頻生成進入“電影級全流程生成”新階段。
Seedance 2.0定位為“可導(dǎo)演的電影級全流程生成引擎”,以導(dǎo)演級多鏡頭敘事、原生音畫同步、跨鏡頭角色一致性等核心能力,明顯降低視頻創(chuàng)作門檻。
在可控性方面,Seedance 2.0實現(xiàn)全方位突破,支持9張圖片、3段視頻、3段音頻的多素材組合輸入,實現(xiàn)動作、特效、運鏡、人物、場景、音效等創(chuàng)作要素的精準(zhǔn)指定,將AI生成從被動推測轉(zhuǎn)變?yōu)橹鲃訄?zhí)行。
在多鏡頭敘事中保持角色特征、服裝紋理、場景細(xì)節(jié)的高度統(tǒng)一,可生成30—60秒連貫敘事視頻,徹底解決長鏡頭下的畫面崩壞、風(fēng)格漂移問題,模型視頻生成可用率從50%提升至80%—90%。
原生音畫同步是Seedance 2.0的另一大突破。該模型突破傳統(tǒng)“先視頻后配音”的后期疊加模式,實現(xiàn)音視頻原生聯(lián)合生成,在畫面創(chuàng)作的同時完成匹配音效、配樂生成,實現(xiàn)精準(zhǔn)口型同步與情緒匹配,大幅簡化音畫對齊后期流程,提升虛擬角色敘事表現(xiàn)力與內(nèi)容沉浸感。
智能導(dǎo)演功能則大幅降低專業(yè)創(chuàng)作門檻。模型具備自動分鏡與運鏡能力,可根據(jù)文字提示詞或故事描述,自動分析敘事邏輯,規(guī)劃景別變化、機位運動,生成時空連貫的視頻序列,將專業(yè)導(dǎo)演級的鏡頭語言能力集成于模型,讓普通創(chuàng)作者可制作具備電影感的視頻內(nèi)容,推動創(chuàng)作能力全民化普及。
這些技術(shù)突破帶來的直接影響是,內(nèi)容創(chuàng)作的試錯成本與制作成本大幅下降。
5秒特效鏡頭制作的成本相比傳統(tǒng)人力制作實現(xiàn)千倍級壓縮;90分鐘影視級項目制作成本也從萬元級降至千元級。這意味著依賴高頻內(nèi)容供給的行業(yè),將從“人力密集型制作邏輯”轉(zhuǎn)向“算力驅(qū)動型規(guī)模化生產(chǎn)邏輯”,盈利模型和產(chǎn)能上限被系統(tǒng)性抬升。
AI漫劇、AI短劇等形態(tài)對制作效率與成本敏感度高,將成為Seedance 2.0的優(yōu)先落地場景。頂尖創(chuàng)作能力被技術(shù)平權(quán)至個人與中小團隊,普通創(chuàng)作者與專業(yè)工作室之間的制作能力差距被快速壓縮,小團隊甚至個人即可完成類電影級動畫與視頻內(nèi)容生產(chǎn)。
更有意思的是,過去往往是國內(nèi)用戶費盡心思去體驗國外的AI工具,而這次,Seedance 2.0反而成為海外網(wǎng)友“爭相體驗”的對象。
由于該模型在部分國家和地區(qū)尚未開放,不少海外網(wǎng)友在社交平臺頻頻“催上線”、詢問開放時間。同時,抖音已在旗下AI助手App豆包內(nèi)開啟視頻生成模型Seedance 2.0的灰度測試,已有一批海外博主專門制作了詳細(xì)教程,分享如何通過中國手機號完成注冊,并一步步體驗Seedance 2.0的完整流程。
這不僅是中國技術(shù)的勝利,更是北京AI企業(yè)在核心技術(shù)賽道上實現(xiàn)全球引領(lǐng)的生動注腳。
新京報貝殼財經(jīng)記者 羅亦丹
編輯 俞金旻
校對 賈寧
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.