<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      螞蟻發布并開源萬億參數思考模型Ring-1T,綜合能力逼近GPT-5

      0
      分享至

      10月14日凌晨,螞蟻集團正式推出萬億參數思考模型Ring-1T,并全面開源模型權重、訓練配方。Ring-1T在9月30日開源的預覽版Ring-1T-preview基礎上,持續擴展大規模可驗證獎勵強化學習(RLVR)訓練,進一步激發萬億基座的自然語言推理能力,并通過 RLHF 訓練完善模型通用能力,在各項任務榜單上表現更加均衡。

      為了持續激發Ring-1T的數學等復雜推理能力,此次百靈團隊挑戰了難度更高的IMO2025(國際數學奧利匹克)賽題,將Ring-1T接入多智能體框架AWorld,使用純自然語言推理進行解題。實驗結果顯示,Ring-1T僅用一次解出了第1、3、4、5題,相當于IMO銀牌水平,成為首個能拿IMO國際奧數獎的開源系統。Ring-1T在第三次嘗試IMO時對第2題幾何證明也給出了接近滿分的證明過程,在頂流大模型幾乎全軍覆沒的第六題中將答案收斂到與Gemini 2.5 Pro 相同的“4048”(正確答案為2112)。作為一款思考模型,Ring-1T也表現出了極佳的通用能力,在“人類偏好對齊”測試Arena-Hard V2中,Ring-1T以81.59的成功率居于開源模型榜首,逼近GPT-5-Thinking(High)82.91的成績。在面向嚴謹領域的醫療問答HealthBench測評中,Ring-1T也以最高分取得開源領域最佳。



      萬億參數思考模型訓練最大難題是訓推精度差異,即訓練階段與推理階段因實現細節差異導致的訓練和推理精度不一致,進而導致訓練崩潰。在Ring-1T模型中,螞蟻采用了自研的“棒冰(icepop)”算法來應對這項行業難題,即用帶掩碼的雙向截斷技術把訓練-推理分布差異凍結在低水位,確保長序列、長周期訓練不崩。此外,應對萬億參數模型強化學習訓練,螞蟻還自研了高性能強化學習系統ASystem(其中包含已開源的高性能強化學習框架AReaL),特別針對萬億參數模型的顯存管理和訓推權重交換問題做了精細的優化,實現了單機顯存碎片秒級回收、權重零冗余交換,把大規模RL訓練穩定跑成日常。



      (圖左:GRPO訓推差異隨著訓練成指數上升,icepop較為平穩;圖右:訓推差異最大值,GRPO隨著訓練上升非常明顯,icepop維持在較低水位)

      此外,本次發布的Ring-1T模型繼續采用Ling 2.0架構的1T base模型做后訓練,Ling 2.0采用了包括高度稀疏的MoE架構,1/32的專家激活比、FP8混合精度、MTP等諸多特性實現高效訓練與推理。在后訓練階段,螞蟻百靈團隊通過LongCoT-SFT + RLVR + RLHF多階段訓練,顯著提升了模型的復雜推理能力以及指令跟隨和創意寫作等通用能力。

      據百靈團隊透露,Ring-1T模型是其在萬億思考模型上的首次嘗試,螞蟻百靈團隊會在后續的版本中繼續完善模型性能。目前,用戶可通過HuggingFace、魔搭社區下載模型,并通過螞蟻百寶箱等平臺在線體驗。



      據了解,截止目前螞蟻百靈大模型已經發布18款模型,已形成從160億總參數到1萬億總參數的大語言模型產品矩陣,其中兩款萬億參數模型—萬億參數通用大語言模型Ling-1T、萬億參數思考模型Ring-1T。隨著兩款萬億參數模型的發布,百靈大模型也正式步入2.0階段。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      心痛!30歲男銷售確認死亡,目擊者講述事發經過,車主懵了

      心痛!30歲男銷售確認死亡,目擊者講述事發經過,車主懵了

      魔都姐姐雜談
      2025-12-20 09:19:55
      剎車失靈狂奔490公里 司機希望退款或換車,網友質疑“自導自演”

      剎車失靈狂奔490公里 司機希望退款或換車,網友質疑“自導自演”

      半島晨報
      2025-12-20 14:45:12
      杭州男子停車救人,沒想到救的竟是自己老婆!腦溢血9個月沒有后遺癥,網友:真的是愛的魔力……

      杭州男子停車救人,沒想到救的竟是自己老婆!腦溢血9個月沒有后遺癥,網友:真的是愛的魔力……

      環球網資訊
      2025-12-20 17:20:34
      泰柬之戰的效果來啦!柬埔寨電詐分子上演大逃亡,場面震撼……

      泰柬之戰的效果來啦!柬埔寨電詐分子上演大逃亡,場面震撼……

      翻開歷史和現實
      2025-12-20 15:46:00
      南京導航集體失靈,定位軟件全趴窩!連北斗都不行,戰時就危險了

      南京導航集體失靈,定位軟件全趴窩!連北斗都不行,戰時就危險了

      墨蘭史書
      2025-12-19 18:20:05
      “邪修大法”做家務就是快!一分錢不花,家里就窗明幾凈~

      “邪修大法”做家務就是快!一分錢不花,家里就窗明幾凈~

      裝修秀
      2025-12-19 11:30:03
      圣誕節快到了,給個準話,還要不要抵制洋節?

      圣誕節快到了,給個準話,還要不要抵制洋節?

      沉思的野獸
      2025-12-19 19:07:28
      兩條流氓新聞,每個字都寫滿了無恥!

      兩條流氓新聞,每個字都寫滿了無恥!

      胖胖說他不胖
      2025-12-20 11:00:14
      深圳16歲“烤雞少年”回應日營業額過萬:利潤約一到兩千,若重來想好好讀書

      深圳16歲“烤雞少年”回應日營業額過萬:利潤約一到兩千,若重來想好好讀書

      紅星新聞
      2025-12-20 19:39:12
      在這個時代,HiFi音響為什么必須死?

      在這個時代,HiFi音響為什么必須死?

      電科技網
      2025-12-19 09:00:07
      要解開南京博物院捐贈之謎,建議先查清這神秘的兩個人

      要解開南京博物院捐贈之謎,建議先查清這神秘的兩個人

      李老逵亂擺龍門陣
      2025-12-20 10:54:00
      咸魚還是太全面了,怪不得人稱國內黑市

      咸魚還是太全面了,怪不得人稱國內黑市

      另子維愛讀史
      2025-12-20 17:07:20
      施瓦辛格深夜警告:晚上健身,就是自殘!

      施瓦辛格深夜警告:晚上健身,就是自殘!

      徐德文科學頻道
      2025-12-19 23:27:25
      大風追蹤 | 27歲海歸女子家中遇害第555天后一審宣判,兇手犯故意殺人罪判死緩,遇害女子母親:將申請抗訴

      大風追蹤 | 27歲海歸女子家中遇害第555天后一審宣判,兇手犯故意殺人罪判死緩,遇害女子母親:將申請抗訴

      大風新聞
      2025-12-20 15:53:02
      朱孝天嫉妒心藏不住了!公開嘲諷阿信“又老又丑”,評論區已淪陷

      朱孝天嫉妒心藏不住了!公開嘲諷阿信“又老又丑”,評論區已淪陷

      楓塵余往逝
      2025-12-20 20:24:53
      韓紅為小洛熙發聲:錯得太離譜!尸檢報告曝光,5月嬰兒本可痊愈

      韓紅為小洛熙發聲:錯得太離譜!尸檢報告曝光,5月嬰兒本可痊愈

      千言娛樂記
      2025-12-20 19:17:42
      “最低選擇299元有女孩陪侍套餐”,記者說只想看電影,“私人影院”服務員直接讓記者去別家看

      “最低選擇299元有女孩陪侍套餐”,記者說只想看電影,“私人影院”服務員直接讓記者去別家看

      環球網資訊
      2025-12-20 12:20:07
      克林頓罕見強硬發聲:這不是烏克蘭的戰爭,而是美國的戰爭!

      克林頓罕見強硬發聲:這不是烏克蘭的戰爭,而是美國的戰爭!

      老馬拉車莫少裝
      2025-12-20 14:50:21
      科學家最終確定:仙女座正在撞向銀河系,速度高達每秒300公里

      科學家最終確定:仙女座正在撞向銀河系,速度高達每秒300公里

      觀察宇宙
      2025-12-19 21:59:03
      1-1大冷!中國隊逼平韓國隊,末輪贏球=擺脫倒數第一

      1-1大冷!中國隊逼平韓國隊,末輪贏球=擺脫倒數第一

      何老師呀
      2025-12-20 16:36:13
      2025-12-20 23:19:00
      光錐智能 incentive-icons
      光錐智能
      來這里,看千行百業的數字化、智能化。
      881文章數 138關注度
      往期回顧 全部

      科技要聞

      許四清:具身智能的"ChatGPT時刻"還未到來

      頭條要聞

      美方最新表態:不會強迫烏克蘭接受協議

      頭條要聞

      美方最新表態:不會強迫烏克蘭接受協議

      體育要聞

      我開了20年大巴,現在是一名西甲主帥

      娛樂要聞

      2026央視跨年晚會陣容曝光,豪華陣仗

      財經要聞

      求解“地方財政困難”

      汽車要聞

      嵐圖推進L3量產測試 已完成11萬公里實際道路驗證

      態度原創

      教育
      旅游
      健康
      公開課
      軍事航空

      教育要聞

      建鄴教育:全區中考連續19年超市均分,三所學校高考成績再攀新高

      旅游要聞

      虹口新春“五必”榜單來啦!一季度“樂購樂游”攻略輕松拿捏!

      這些新療法,讓化療不再那么痛苦

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      澤連斯基:前線局勢愈發艱難

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲精品成人无码熟妇在线| 制服.丝袜.亚洲.中文.综合懂| 亚洲无人区码一码二码三码的含义| 人妻欧美日韩综合制服| 人妻偷拍一区二区三区| 日韩一欧美内射在线观看| 中文字幕精品aⅴ内射夜夜夜| 少妇无码视频| 无码国产成人午夜电影在线观看| 欧美日一本| 91丝袜高潮流白浆潮喷在线观看| 91在线视频观看| 国产精品免费AⅤ片在线观看| 在线亚洲人成电影网站色www| 欧洲亚洲无码| 久久久久久久| 三成人免费看| 免费乱理伦片在线观看| av无码免费一区二区三区| 亚洲第一成人在线| 亚洲黄色片| 69精品| 国产精品久久久久久久久久| 亚洲精品人妻系列| 3P在线观看视频| 国产精品自拍中文字幕| 精品国内自产拍在线观看视频| 精品人妻一区二区三区-国产精品| 91成人社区| 日韩激情一区二区| 2021av在线天堂网| 国产又爽又黄无码无遮挡在线观看| 亚洲精品一区二区三区在线观看| 五月婷视频| 99久久国产精品无码| 大桥未久亚洲无av码在线| 免青青草免费观看视频在线| 无码视频一区二区三区在线观看| 九九久久精品国产| 嗯91色色| 色性AV|