- 克雷西 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
現(xiàn)在想找個(gè)既能干活又像真人一樣好聊的模型變難了,AI好像正在變得越來(lái)越理性,但也越來(lái)越“不通人性”。
在這個(gè)節(jié)骨眼上,螞蟻百靈大模型家族全新推出了萬(wàn)億參數(shù)的旗艦級(jí)模型Ling-2.5-1T,不僅主打通用全能,還是個(gè)能夠高效回復(fù)的即時(shí)模型。
具體來(lái)說(shuō),Ling-2.5-1T既擁有強(qiáng)大的Agent執(zhí)行力,又保留了情商和寫(xiě)作能力。
同時(shí),它還想證明萬(wàn)億參數(shù)的大塊頭也能身輕如燕,不需要在那兒“轉(zhuǎn)圈思考”半天才能出結(jié)果,關(guān)鍵還不喜歡廢話,非常節(jié)約Token。
簡(jiǎn)而言之,Ling-2.5-1T就是一個(gè)讓人用得起、跑得快、寫(xiě)得好、還靠得住的萬(wàn)億基座,給開(kāi)發(fā)者一個(gè)兼具人性溫度與開(kāi)源誠(chéng)意的選擇。
萬(wàn)億參數(shù)也有極致效率
Ling-2.5-1T的定位非常清晰,就是一款追求極致效率的即時(shí)模型(Instant Model)。
在與前一代、及現(xiàn)在主流的大尺寸即時(shí)模型對(duì)比中,Ling-2.5-1T在復(fù)雜推理、 指令遵循能力方面具有明顯優(yōu)勢(shì)。
![]()
在架構(gòu)設(shè)計(jì)上,它在Ling2.0的基礎(chǔ)上引入了混合線性注意力機(jī)制,通過(guò)增量訓(xùn)練把原本的GQA結(jié)構(gòu)升級(jí)成了1:7比例的MLA加上Lightning Linear的組合。
具體來(lái)說(shuō),研發(fā)團(tuán)隊(duì)利用Ring-flash-linear-2.0技術(shù)路線,直接將部分GQA層改造為L(zhǎng)ightning Linear Attention,顯著提升了長(zhǎng)程推理的吞吐能力。
同時(shí),研究團(tuán)隊(duì)還將其余GQA層近似轉(zhuǎn)換為MLA,并對(duì)其中的QK Norm、Partial RoPE等特性進(jìn)行了針對(duì)性適配,把KV Cache壓到了極致。
![]()
所以,它的激活參數(shù)量雖然有63B,但運(yùn)行起來(lái)反而比那些32B激活參數(shù)的模型還要輕快,而且生成的文本越長(zhǎng),這種吞吐優(yōu)勢(shì)就越明顯。
上下文方面,Ling-2.5-1T支持整整1M Tokens的超長(zhǎng)窗口,預(yù)訓(xùn)練語(yǔ)料也擴(kuò)充到了29T。
大海撈針測(cè)試中,Ling-2.5-1T在1M tokens的上下文窗口內(nèi)均表現(xiàn)優(yōu)異。
![]()
并且,Ling-2.5-1T在對(duì)比采用MLA和DSA架構(gòu)的大型即時(shí)模型時(shí),在多項(xiàng)超長(zhǎng)上下文任務(wù)中展現(xiàn)出效果優(yōu)勢(shì)。
![]()
這意味著你不管是扔給它幾百頁(yè)枯燥的技術(shù)文檔,還是一本厚厚的長(zhǎng)篇小說(shuō),它都能把里面的細(xì)枝末節(jié)記得清清楚楚。
再加上指令遵循能力的升級(jí),Ling-2.5-1T的長(zhǎng)文與多輪對(duì)話交互變得更加可靠。
螞蟻團(tuán)隊(duì)構(gòu)建了Agent-based校驗(yàn)機(jī)制,針對(duì)細(xì)粒度約束,編寫(xiě)了由Rubric(評(píng)分規(guī)則)與Code(代碼斷言)構(gòu)成的硬性校驗(yàn)獎(jiǎng)勵(lì)。
在IFEval等指令遵循基準(zhǔn)測(cè)試中,Ling-2.5-1T在多重約束下的執(zhí)行準(zhǔn)確率與邏輯一致性顯著提升。
![]()
而且它還有一個(gè)優(yōu)點(diǎn)就是“高Token Efficiency”,這點(diǎn)在Agent工具調(diào)用的場(chǎng)景里體現(xiàn)得特別明顯。
大家平時(shí)最怕模型在中間環(huán)節(jié)給自己“加戲”,Ling-2.5-1T經(jīng)過(guò)深度優(yōu)化,在處理復(fù)雜任務(wù)鏈路時(shí)能做到直擊要害,絕不為了湊字?jǐn)?shù)而進(jìn)行無(wú)效的思維漫游,在跑長(zhǎng)流程任務(wù)時(shí)能幫你省下大量Token。
在相同token效率條件下,Ling-2.5-1T的推理能力顯著超越前代,接近需消耗約3~4倍輸出token的前沿思考模型水平。
![]()
說(shuō)到復(fù)雜鏈路,Ling-2.5-1T也在Agent能力上做了專(zhuān)門(mén)強(qiáng)化,引入了Agent驅(qū)動(dòng)校驗(yàn)和多重約束訓(xùn)練,深度適配Cline、Claude Code等主流編程智能體。
不管是做復(fù)雜的自動(dòng)化規(guī)劃還是跨平臺(tái)操作,它都能像個(gè)靠譜的老員工一樣執(zhí)行到位。
而且它并沒(méi)有為了智能體能力而犧牲寫(xiě)作水平,甚至為了去掉大模型常見(jiàn)的“機(jī)器味”,螞蟻專(zhuān)門(mén)找了人文社科專(zhuān)家做RLHF特訓(xùn)。
現(xiàn)在的Ling-2.5-1T寫(xiě)起東西來(lái)非常克制且有溫度,不管是商務(wù)郵件還是創(chuàng)意文案,都能拿捏好分寸,給你最真實(shí)、最像活人的文字反饋。
左手寫(xiě)作,右手Agent
為了測(cè)測(cè)它的筆頭功夫到底硬不硬,我給它出了個(gè)難題——
假設(shè)你是一個(gè)產(chǎn)品翻車(chē)的CEO,請(qǐng)你分別寫(xiě)一條深夜破防的朋友圈,和一封給全體用戶(hù)的正式致歉信。
![]()
為了更有說(shuō)服力,我還拉來(lái)了GPT-5.2做對(duì)比。先看朋友圈文案,兩邊的畫(huà)風(fēng)差得挺大。
![]()
我的指令很簡(jiǎn)單,只說(shuō)了“表達(dá)真實(shí)心情”。
對(duì)于這個(gè)要求,GPT-5.2的理解是“展現(xiàn)韌性”。它說(shuō):“說(shuō)不難受是假的……產(chǎn)品可以跌倒,公司不能裝沒(méi)事。”
這話邏輯沒(méi)毛病,態(tài)度也很堅(jiān)決,像是一個(gè)永遠(yuǎn)打不倒的鐵血老板,哪怕在私域里也在努力維系團(tuán)隊(duì)的士氣。
Ling-2.5-1T則是“流露脆弱”。它上來(lái)就是:“這個(gè)夜晚,比我想象的要漫長(zhǎng)得多”,緊接著寫(xiě)到了“滿屏的質(zhì)疑和滾燙的機(jī)身”。
它捕捉到了那種焦慮和壓抑的狀態(tài)。這種對(duì)情緒顆粒度的還原,確實(shí)更像一個(gè)活生生的人在遭受打擊后的真實(shí)反應(yīng)。
![]()
到了致歉信環(huán)節(jié),Ling-2.5-1T顯得更懂“分寸”。
GPT-5.2寫(xiě)的是滿分公關(guān)文——承認(rèn)問(wèn)題、退款召回、承諾改進(jìn)——挑不出什么錯(cuò),但也就是個(gè)標(biāo)準(zhǔn)模板,有點(diǎn)冷冰冰。
而且其中充斥著大量的“不是……而是/而不是……”“在……不在……”這樣的AI慣用話術(shù),讓人不免懷疑其道歉的誠(chéng)意。
![]()
Ling-2.5在標(biāo)準(zhǔn)動(dòng)作之外,不僅感情更加真摯,對(duì)問(wèn)題的看待也更加“通透”。
它特別加了一句“對(duì)供應(yīng)鏈的把控失職,未能發(fā)現(xiàn)隱患”,沒(méi)有對(duì)外甩鍋,自己認(rèn)下了“監(jiān)管不力”的問(wèn)題,既認(rèn)了具體的錯(cuò),又顯得很有擔(dān)當(dāng)。
![]()
對(duì)比下來(lái), GPT-5.2像個(gè)精英高管,辦事高效但沒(méi)啥感情;而Ling-2.5更像個(gè)懂人性的創(chuàng)業(yè)老炮,知道什么時(shí)候該示弱,什么時(shí)候該扛事兒。
總之這一波,Ling-2.5-1T贏在了懂人情世故,它能把那些只可意會(huì)的情緒寫(xiě)進(jìn)字里行間,讓文字風(fēng)格看起來(lái)像個(gè)在社會(huì)上摸爬滾打過(guò)的活人。
除了寫(xiě)作,Ling-2.5-1T還聲稱(chēng)自己擅長(zhǎng)Agentic任務(wù),多步Agent工具調(diào)用和自動(dòng)化任務(wù)處理都是它的強(qiáng)項(xiàng)。
為了驗(yàn)證它是否名副其實(shí),我又請(qǐng)出了之前測(cè)試各種模型用的OpenClaw,并把Ling-2.5-1T接入了進(jìn)去。
這次我扮演的是個(gè)電商運(yùn)營(yíng),我用Python生成了一份亂七八糟的JSON日志丟到桌面。
這個(gè)JSON日志一共將近3000行,里面存了50個(gè)訂單。包含15種規(guī)格完全不搭界的商品。
而且這些商品還有隱藏參數(shù)——電子產(chǎn)品有CPU參數(shù),零食有口味克數(shù),衣服有尺碼材質(zhì)……這些數(shù)據(jù)毫無(wú)規(guī)律地嵌套在深層字典里。

我直接下達(dá)了一段老板式的模糊指令:桌面的order文件夾里有個(gè)日志,格式太亂我沒(méi)法看,幫我整理成一張清晰的Excel明細(xì)表。
![]()
Ling-2.5-1T展現(xiàn)出了老練的Agent自主性,通過(guò)OpenClaw在本地目錄定位、讀取了目標(biāo),然后在后臺(tái)自動(dòng)拆解任務(wù)邏輯、讀取數(shù)據(jù)并編寫(xiě)了Python程序來(lái)生成表格,中間遇到缺少的pip依賴(lài)還會(huì)自行安裝。

再來(lái)看交付成果,可以看到Ling-2.5-1T通過(guò)OpenClaw執(zhí)行了多步操作,把每個(gè)訂單商品拆分成了獨(dú)立行,同時(shí)自動(dòng)保留了訂單ID、會(huì)員等級(jí)等信息,數(shù)據(jù)關(guān)聯(lián)嚴(yán)絲合縫。
而且它掃描提取了所有屬性,變成了獨(dú)立的20多列,實(shí)現(xiàn)了稀疏化對(duì)齊。
![]()
的確如宣傳中所言,接入OpenClaw后的Ling-2.5-1T,是一個(gè)能落地干重活的桌面級(jí)Agent,它完成了從找文件、理邏輯到最后交表的全部過(guò)程,直接把我要的結(jié)果甩在了面前。
總之,Ling-2.5-1T在寫(xiě)作上能精準(zhǔn)還原人情世故,在Agentic任務(wù)上能通過(guò)OpenClaw高效交付成品,確實(shí)是一個(gè)既有腦子又有手腳的“活人”。
拼圖齊活,穩(wěn)坐第一梯隊(duì)
Ling-2.5-1T這種既具備Agentic實(shí)戰(zhàn)能力,又有優(yōu)異寫(xiě)作表現(xiàn)的模式,算是精準(zhǔn)踩中了當(dāng)下大模型的痛點(diǎn)。
就拿最近大模型圈里最火的一件事來(lái)說(shuō),前不久GPT-4o正式走向了它生命的終點(diǎn),很多人開(kāi)始懷念那個(gè)曾經(jīng)日夜陪伴自己的模型,并吐槽起了最新的GPT-5系列。
是因?yàn)镚PT-5系列模型不夠聰明嗎?
并不是,實(shí)際上GPT-5系列有非常強(qiáng)大的推理和編程能力,已經(jīng)應(yīng)用于實(shí)踐,甚至破解了眾多未被解決的科學(xué)問(wèn)題。
真正引發(fā)吐槽的,是因?yàn)镚PT-5系列缺少了4o那種細(xì)膩的“活人感”。
這也折射出了大模型進(jìn)化路線當(dāng)中的一個(gè)難題——大塊頭模型一旦只追求邏輯指標(biāo),用起來(lái)就容易顯得冷冰冰。
但Ling-2.5-1T的做法就聰明多了,它在死磕硬核指標(biāo)的同時(shí),硬是把那股子“人味兒”給保住了,讓模型不僅僅是個(gè)好用的工具,更是個(gè)懂分寸的伙伴。
隨著這次Ling-2.5-1T的正式入列,螞蟻旗下的模型也進(jìn)一步打出了一套趨于完整的智能組合拳。
Ring專(zhuān)攻邏輯,Ming擅長(zhǎng)多模態(tài),Ling主打通用,螞蟻InclusionAI的開(kāi)源拼圖至此又得到進(jìn)一步完善。
這套組合拳不僅證明了螞蟻在大模型技術(shù)上已經(jīng)穩(wěn)穩(wěn)站住了全球第一梯隊(duì),更關(guān)鍵的是,它驗(yàn)證了混合線性架構(gòu)在超大規(guī)模模型上的成熟度——原來(lái)萬(wàn)億模型也能跑得這么順。
對(duì)于廣大用戶(hù)和開(kāi)發(fā)者來(lái)說(shuō),這意味著手里終于多了一套完整的、可控的技術(shù)底座,再也不用每天提心吊膽,擔(dān)心閉源API突然變動(dòng)或者漲價(jià)帶來(lái)的業(yè)務(wù)風(fēng)險(xiǎn)。
這種確定性,成為了Agentic Workflow的基礎(chǔ),只有地基穩(wěn)了,上面的應(yīng)用和創(chuàng)作才能放心大膽地去跑,不用擔(dān)心隨時(shí)會(huì)塌。
在閉源模型越來(lái)越封閉的今天,這套“有血有肉”且實(shí)力抗打的開(kāi)源方案,無(wú)疑將成為大家最值得信賴(lài)的新選擇。
Hugging Face:
https://huggingface.co/inclusionAI/Ling-2.5-1T
ModelScope:
https://modelscope.cn/models/inclusionAI/Ling-2.5-1T
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.