從寫代碼到做工程，北京AI用硬核技術(shù)改寫全球AI競賽規(guī)則

2026-02-17 09:11:03　來源: 貝殼財經(jīng)

北京舉報

分享至

2026年，全球人工智能領(lǐng)域迎來新一輪技術(shù)爆發(fā)潮。在這場激烈的技術(shù)競賽中，北京企業(yè)展現(xiàn)出強勁實力，在全球掀起“驚濤駭浪”。

1月8日，智譜AI在香港交易所掛牌上市，成為“全球大模型第一股”，此后發(fā)布的智譜GLM-5在全球權(quán)威榜單中位居全球第四、開源模型第一。2月7日，字節(jié)推出的視頻生成模型Seedance 2.0全球“出圈”，令好萊塢導(dǎo)演驚嘆，讓海外網(wǎng)友在社交平臺“催上線”。Kimi、生數(shù)科技、面壁智能、銀河通用等企業(yè)也相繼推出新一代大模型產(chǎn)品，在通用大語言模型、多模態(tài)視頻生成、代碼編程、具身智能等核心賽道實現(xiàn)全面突破。

北京，這座千年古都，正在以驚人的速度蛻變?yōu)槿駻I創(chuàng)新的策源地。

從“會寫代碼”到“能完成工程”

過去兩年，大模型在代碼生成能力方面的進展業(yè)界有目共睹。但寫代碼和完成工程系統(tǒng)之間，始終橫亙著一道鴻溝。這道鴻溝，正在被北京的企業(yè)們用實實在在的技術(shù)突破填平。GLM-5的發(fā)布，標(biāo)志著國產(chǎn)大模型完成了從“初級程序員”到“總架構(gòu)師”的進化。

GLM-5采用了744B總參數(shù)、40B激活參數(shù)的MoE架構(gòu)，引入DeepSeek稀疏注意力機制（DSA），部署成本降低30%以上。在Vending Bench 2測試中，GLM-5需要完全自主地經(jīng)營一年的售貨機業(yè)務(wù)，最終實現(xiàn)了4432美元的賬戶余額，這一表現(xiàn)已經(jīng)非常接近頂級的閉源模型。

一個更具說服力的案例是，B站知名游戲博主、獨立游戲開發(fā)者“夜神不說話”利用GLM-5，在12小時內(nèi)開發(fā)出一款名為《逃離千禧年》的游戲，完成了傳統(tǒng)開發(fā)模式下需要2～3個月才能完成的工作量。

開發(fā)者通過GLM-5調(diào)用多Agent同步并發(fā)架構(gòu)，一人分飾多角，GLM-5不僅在短短20分鐘內(nèi)生成了包含1275行代碼的復(fù)雜背包系統(tǒng)，且邏輯閉環(huán)無幻覺，還協(xié)助完成了美術(shù)素材的Python自動化處理腳本及音樂風(fēng)格設(shè)計文檔的生成。

這不是炫技，而是真正的生產(chǎn)力革命。

實際上，早在GLM-5正式發(fā)布之前，其測試版本“Pony Alpha”便已在海外開發(fā)者社區(qū)引起轟動。這個神秘模型在完全無人干預(yù)下，能自主修復(fù)代碼、讀取日志，耗時數(shù)天構(gòu)建出一個可用的C語言編譯器；甚至有人用它從零開發(fā)了手機應(yīng)用，直接打包上架了應(yīng)用商店。

2月11日深夜，謎底揭曉。被硅谷追捧的神秘模型“Pony Alpha”就是中國AI公司智譜發(fā)布并開源的旗艦?zāi)Ｐ虶LM-5。海內(nèi)外對GLM-5的贊譽不僅表現(xiàn)在熱度上，同時也被迅速轉(zhuǎn)化成了購買欲。智譜官方每天限額的GLM Coding Plan即使?jié)q價30%也是秒空，沒能上車的開發(fā)者也只能每天蹲點搶，甚至就連Ollama的云服務(wù)也在上線GLM-5之后被擠爆。

這說明，市場愿意為真正的技術(shù)突破買單。

從“單兵作戰(zhàn)”到“集群協(xié)作”

處理真實世界的復(fù)雜難題不能只靠單打獨斗，還需要更多團隊協(xié)作。這正是月之暗面Kimi K2.5的核心突破所在。

Kimi K2.5的更新中，研發(fā)團隊重構(gòu)了強化學(xué)習(xí)基建，通過優(yōu)化訓(xùn)練算法進行全新探索，推出Agent集群，讓Agent從單兵突破進化成集群式作戰(zhàn)。執(zhí)行復(fù)雜任務(wù)時，K2.5不再是單一的“全能專家”，而是化身為一支即時組建的專業(yè)團隊。它能根據(jù)任務(wù)需求，現(xiàn)場調(diào)度多達(dá)100個不同專業(yè)背景的“分身”，并行處理1500個步驟，所有的角色分配與任務(wù)拆解無需預(yù)設(shè)，全由K2.5即時決策。這不是簡單的并行計算，而是智能化的任務(wù)分解與協(xié)同。

借助Agent集群，用戶可以讓一群“分析師”分頭完成100家公司的市場調(diào)研，動員“語言專家團”翻譯300頁文檔，還能派出不同的“研究員”綜述5篇跨專業(yè)的論文，讓效率提升十倍以上。

更重要的是，Kimi K2.5的Agent能力也全面擴展至辦公場景。通過對Word、Excel、PPT、PDF等常用辦公軟件的深度學(xué)習(xí)，用戶只需通過自然語言下達(dá)簡單指令，即可成為快速精通辦公軟件的專業(yè)用戶，并實現(xiàn)不同格式間的自由轉(zhuǎn)換。

這種能力的突破，意味著AI正在從“工具”進化為“伙伴”，從“助手”升級為“協(xié)作者”。

在全球范圍內(nèi)，Kimi K2.5的表現(xiàn)同樣令人矚目。在HLE-Full w/ tools基準(zhǔn)測試中，Kimi K2.5以50.2%的得分登頂，比GPT-5.2高出4.7個百分點，比Claude 4.5 Opus高出7個百分點。這個差距在高難度測試中堪稱“碾壓級”。

這是開源AI首次在高難度工具任務(wù)上正面擊敗閉源頭部模型，具有里程碑意義。

從“內(nèi)容生成”到“電影級生產(chǎn)”

如果說代碼生成和智能體協(xié)作還是“數(shù)字世界”的事，那么視頻生成技術(shù)的突破，則正在徹底改變“內(nèi)容生產(chǎn)”這個萬億級市場。

進入2026年，AI大模型正加速邁過從“炫酷玩具”到“可靠生產(chǎn)力工具”的臨界點。Seedance 2.0提升了視頻生成的穩(wěn)定性與可控性，使模型從“創(chuàng)意工具”轉(zhuǎn)向“生產(chǎn)工具”，標(biāo)志著AI視頻生成進入“電影級全流程生成”新階段。

Seedance 2.0定位為“可導(dǎo)演的電影級全流程生成引擎”，以導(dǎo)演級多鏡頭敘事、原生音畫同步、跨鏡頭角色一致性等核心能力，明顯降低視頻創(chuàng)作門檻。

在可控性方面，Seedance 2.0實現(xiàn)全方位突破，支持9張圖片、3段視頻、3段音頻的多素材組合輸入，實現(xiàn)動作、特效、運鏡、人物、場景、音效等創(chuàng)作要素的精準(zhǔn)指定，將AI生成從被動推測轉(zhuǎn)變?yōu)橹鲃訄?zhí)行。

在多鏡頭敘事中保持角色特征、服裝紋理、場景細(xì)節(jié)的高度統(tǒng)一，可生成30—60秒連貫敘事視頻，徹底解決長鏡頭下的畫面崩壞、風(fēng)格漂移問題，模型視頻生成可用率從50%提升至80%—90%。

原生音畫同步是Seedance 2.0的另一大突破。該模型突破傳統(tǒng)“先視頻后配音”的后期疊加模式，實現(xiàn)音視頻原生聯(lián)合生成，在畫面創(chuàng)作的同時完成匹配音效、配樂生成，實現(xiàn)精準(zhǔn)口型同步與情緒匹配，大幅簡化音畫對齊后期流程，提升虛擬角色敘事表現(xiàn)力與內(nèi)容沉浸感。

智能導(dǎo)演功能則大幅降低專業(yè)創(chuàng)作門檻。模型具備自動分鏡與運鏡能力，可根據(jù)文字提示詞或故事描述，自動分析敘事邏輯，規(guī)劃景別變化、機位運動，生成時空連貫的視頻序列，將專業(yè)導(dǎo)演級的鏡頭語言能力集成于模型，讓普通創(chuàng)作者可制作具備電影感的視頻內(nèi)容，推動創(chuàng)作能力全民化普及。

這些技術(shù)突破帶來的直接影響是，內(nèi)容創(chuàng)作的試錯成本與制作成本大幅下降。

5秒特效鏡頭制作的成本相比傳統(tǒng)人力制作實現(xiàn)千倍級壓縮；90分鐘影視級項目制作成本也從萬元級降至千元級。這意味著依賴高頻內(nèi)容供給的行業(yè)，將從“人力密集型制作邏輯”轉(zhuǎn)向“算力驅(qū)動型規(guī)模化生產(chǎn)邏輯”，盈利模型和產(chǎn)能上限被系統(tǒng)性抬升。

AI漫劇、AI短劇等形態(tài)對制作效率與成本敏感度高，將成為Seedance 2.0的優(yōu)先落地場景。頂尖創(chuàng)作能力被技術(shù)平權(quán)至個人與中小團隊，普通創(chuàng)作者與專業(yè)工作室之間的制作能力差距被快速壓縮，小團隊甚至個人即可完成類電影級動畫與視頻內(nèi)容生產(chǎn)。

更有意思的是，過去往往是國內(nèi)用戶費盡心思去體驗國外的AI工具，而這次，Seedance 2.0反而成為海外網(wǎng)友“爭相體驗”的對象。

由于該模型在部分國家和地區(qū)尚未開放，不少海外網(wǎng)友在社交平臺頻頻“催上線”、詢問開放時間。同時，抖音已在旗下AI助手App豆包內(nèi)開啟視頻生成模型Seedance 2.0的灰度測試，已有一批海外博主專門制作了詳細(xì)教程，分享如何通過中國手機號完成注冊，并一步步體驗Seedance 2.0的完整流程。

這不僅是中國技術(shù)的勝利，更是北京AI企業(yè)在核心技術(shù)賽道上實現(xiàn)全球引領(lǐng)的生動注腳。

新京報貝殼財經(jīng)記者羅亦丹

編輯俞金旻

校對賈寧

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.