![]()
大模型開源生態有了新變化。
作者丨齊鋮湧
編輯丨陳彩嫻
![]()
剛剛過去的國慶,各行各業進入放假模式,但大模型行業卻一刻也沒閑著。
過去的半個月,國內外大模型的頭部團隊有十余款重磅產品發布,但每個團隊的產品側重不同。
其中,九月下旬,阿里發布以 Qwen3-Max 為代表的全家桶產品,大秀了一把肌肉;九月末,DeepSeek 和 Anthropic 瞄準真實編程場景,先后發布了 DeepSeek V3.2-Exp 和 Claude Sonnet 4.5,此外,智譜也拿出 GLM-4.6,目標沖擊國內最強代碼模型。
有人全盤布局,也有人專攻精尖,在大模型領域競爭駛向深水區后,各個公司戰略路線出現了分野。
10 月 9 日凌晨,螞蟻百靈大模型團隊奇襲般官宣了一款自家最新語言大模型 Ling-1T,參數量達到 1000B(即 1萬億參數)。然而,就在十天前,百靈團隊才將自研 Ring-1T-preview 大模型開源。
短短十天內,發布并開源兩款萬億參數模型,如此密集的產品發布讓螞蟻百靈大模型成為了行業熱議對象。
與此同時,這樣毫無保留的開源動作,也讓業界猜測:螞蟻到底意圖何在?
01
探索智能上限是終極目標
據了解,螞蟻集團研發的基礎大模型取名“百靈”,寓意“百試百靈”,也蘊含科技普惠之意,和阿里一樣,螞蟻也是獨立團隊獨立研發,Ling-1T 和 Ring-1T-preview 分別是螞蟻百靈團隊研發的非思考模型和思考模型。
過去半年時間里,螞蟻一直在對百靈大模型進行迭代優化,并且自上而下形成了三條技術探索路線:
一條是以 MoE 架構為基礎的非思考模型 Ling-Series,另一條是思考模型 Ring-Series,第三條是原生全模態大模型 Ming-Series 。
如今,螞蟻百靈團隊在 Ling 和 Ring 兩款模型路線上都已經將參數量擴大到萬億參數。
萬億參數,幾乎等同于人類大腦神經元數量,相當于讓 AI 擁有等同于人腦的處理能力,但萬億參數非常難訓。目前,國內能達到萬億參數規模的大模型也是鳳毛麟角。
除了剛才提到的百靈大模型 Ling-1T 和 Ring-1T-preview ,目前國內公開資料可查的萬億參數大模型只有 Kimi K2、阿里 Qwen3-Max 和騰訊混元大模型等少數幾個模型,可見大模型領域“萬億俱樂部”的門檻之高。
雖然今年以來盛行“數據撞墻論”和“預訓練終結”的觀點,但越來越多科學家也形成了一個新的共識:更大的參數,更多的數據,仍然能帶來持續的性能提升。
阿里的算法負責人林俊旸公開表態:Scaling Law 仍然沒見頂,訓練數據的增加,參數規模的擴大,都還能看到模型性能的提升。
楊植麟的Kimi 團隊更是克服萬難悶頭苦干,終于在兩個月前,拿出了萬億參數的旗艦模型K2。通義千問團隊直接提出了“大就是好”的暴論,并且讓 Qwen3 堅定不移地沿著“Just Scale it”的擴展路徑前進。
由此可見,大家都還在朝著“探索智能上限”出發。
02
百靈大模型加速涌現
據了解,過去一年里,平均7天就有一款高性能大模型誕生。可以說,國內不缺大模型。
但在參數和效率之間,能做到完美平衡的大模型卻不多。
就拿萬億參數模型來說,模型變大了,往往會犧牲推理速度,推理速度上去了,準確率又很難達到。業界知名的旗艦款大參數模型,都能在推理能力和思考效率上做到很不錯的平衡。
這個平衡點,被稱之為帕累托最優,我們經常用多維基準測試的分數來量化對比。這次螞蟻發布的 Ling-1T 在公開的對比榜單中,表現讓人非常意外。
下圖是 Ling-1T 在部分權威基準評測的表現,紅色加粗代表 Ling-1T 的得分獲得 Top1,黑色加粗下劃線表示 Top2:
![]()
我們重點關注的編程與數學推理( Coding & Math )兩個維度上,Ling-1T 表現非常亮眼,甚至多個得分超過 DeepSeek。在知識理解方面,Ling-1T 也比Kimi、GPT-5 主干模型等的得分,高出幾分。
這意味著,Ling-1T 的深度思考能力和泛化能力,以及邏輯推理能力,都非常全面。因此,Ling-1T 會非常擅長從事代碼生成、軟件開發、競賽數學、專業數學、邏輯推理等場景。
但對于萬億參數模型來說,除了綜合性能,還需要考慮一個問題:推理正確率。這就需要引入競賽數學榜單 AIME 25 競賽數學榜單 AIME 25 的挑戰,Ling-1T 的成績如下:
![]()
Ling-1T 在 AIME 25 測試中,與 DeepSeek-V3.1-Terminus、Kimi-K2-Instruct-0905 (開源)以及 GPT-5-main、Gemini-2.5-Pro (閉源)這些旗艦模型對比,展示出更短的思考路徑和更高的推理準確率,能做到支持 128K 長文本窗口處理能力,每個 token 做到約 50B 參數的激活量。
這樣的成績,源自螞蟻百靈團隊長時間的積累與創新。
依托于團隊儲備的二十萬億 Token 高質量文本語料訓練,Ling-1T 吃進了大量優質知識。在預訓練階段, Ling-1T 的訓練團隊讓由 Ling Scaling Laws 自我設置關鍵超參,簡單地說,就是讓大模型自我優化。
同時在強化訓練階段,加入了百靈團隊原創的 LPO 策略優化算法,讓模型回答得更對。
此外,團隊還額外提出了“語法-功能-美學”的混合獎勵機制,提高模型審美。下面這張是 Ling-1T 工程師繪制的模型架構圖:
![]()
不止是剛發布的 Ling-1T 和9月30日發布的 Ring-1T-preview ,螞蟻實際上已經形成了完整的百靈大模型家族。
從尺寸上,包含從160億總參數到1萬億總參數的大語言模型產品矩陣;從模態上,包含了能看能聽能說能畫的,從理解到生成能統一的大模型;
從場景上,也形成了包括手機上可以運行的 Ling-mini,還有能在中小企業服務器上部署的 Ling-flash,以及云端可調用的 Ling-1T。
![]()
這些模型,在過去一段時間,無論是社區榜單還是實際使用上,都得到了很多有效回應。
螞蟻百靈團隊開發的全模態模型 Ming-lite-omni v1.5 甚至在 Hugging Face 模型趨勢榜(any to any)排到過第一的位置。
Ring-1T-preview 發布完的第二天,就沖上了 Hugging Face 模型榜 Text Generation 總榜排名第三,排名第四的也是9月 Ling 團隊發布的混合架構思考模型 Ring-flash-linear-2.0 。
![]()
圖靈獎得主 Yann LeCun(楊立昆)甚至點贊并評論“Impressive”(了不起),了解這位特立獨行大佬的網友表示:“ LeCun 愿意給 LLM(大模型)說句好話不容易”。
![]()
一位蘋果工程師量化完跑起來模型,評價螞蟻百靈模型的性能“Getting closer to GPT-5 at home”(在本地部署上的性能接近 GPT-5)。
![]()
這些技術從業者和開發者們的真實聲音,給予了百靈模型非常正向的反饋。
03
探索 AGI ,亟需參與者們的共建意識
百靈團隊,如此快速地躋身“萬億參數俱樂部”,背后跟螞蟻的戰略動作分不開。作為一家成立了20年的互聯網公司”,螞蟻在 AI 領域的投入一直是非常巨大的。
去年螞蟻20周年時候,螞蟻集團董事長井賢棟宣布:未來20年,螞蟻要做一家科技驅動、創新驅動的公司。螞蟻集團還提出了 AI First 戰略,并將其與“支付寶雙飛輪”和“加速全球化”一齊,并稱為螞蟻集團的三大戰略。
而 Ling-1T 和 Ring-1T-preview 的出現,則是螞蟻 AI First 戰略持續加速的表現。
不選擇閉源道路,而是選擇了開源,足以證明,螞蟻想干一件更長遠的事:
通過技術開放的方式,不斷迭代技術,構建一個真正開放的 AGI 生態。
根據 AI 科技評論了解,目前“萬億參數俱樂部”里能做到完全開源的,只有螞蟻百靈的 Ling-1T 和 Ring-1T-preview ,以及 Kimi 的 K2。
在大模型參數軍備競賽愈演愈烈的 2025 年,投入如此巨大之后,螞蟻選擇直接開源,看似讓人費解。
但如果了解大模型開源背后的意圖,就會明白,當 Ling-1T 和 Ring-1T-preview 這樣萬億參數模型,公布了背后的訓練數據、算法、模型,開發者可以直接利用這些“龐然大物”作為起點,快速構建復雜的應用程序,無需關心底層模型的訓練。一個“使用-反饋-迭代”的正向循環,將極大推動技術共建,加快智能涌現。
這條"技術平權化"的道路,我們并不陌生。今年年初,DeepSeek 的橫空出世,已經為眾多中國大模型頭部玩家們指明了道路。
今年接任螞蟻集團 CEO 的韓歆毅,曾在內部技術日上表達了螞蟻 AI 的主張:
“大家說(螞蟻)聚焦 AI 應用,還要不要做基礎大模型,年初討論的時候我們答案非常堅決,一定要,因為如果基于 AI 做服務和應用,就像訓練一個人去做所有的事,追求智能上限,會讓這個人更加聰明,能夠做更多、更好的服務。我們很堅定去探索 AGI 、探索智能上限。”
螞蟻還專門成立了 InclusionAI 開源組織,建設了大模型全棧技術,包含強化學習推理框架 AReaL、多智能體框架 AWorld 等,這些技術也已經通過開源、開放合作的形式與行業共享共建,讓創作者可以交流共創。
能看得出來,相比于登臺唱戲,螞蟻更加愿意把戲臺搭好,AI 的基礎設施鋪設好,才能吸引更多的人來共建,真正邁向 AGI 。
![]()
未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社區進行轉載!
公眾號轉載請先在「AI科技評論」后臺留言取得授權,轉載時需標注來源并插入本公眾號名片。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.