<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      用 10% GPU 跑通萬億參數 RL!馬驍騰拆解萬億參數大模型的后訓練實戰

      0
      分享至


      整理 | 夢依丹

      出品 | CSDN(ID:CSDNnews)

      左手是提示詞的工程化約束,右手是 Context Learning 的自我進化。

      在 OpenAI 新發布的《Prompt guidance for GPT-5.4》中,反復提到了 Prompt Contracts(提示詞合約)。要求開發者像編寫代碼一樣,嚴謹地定義 Agent 的輸入邊界、輸出格式與工具調用邏輯,進而換取 AI 行為的確定性。

      但在現實操作中,誰又能日復一日地去維護那些冗長、脆弱的“提示詞代碼”?

      真正的 Agent,不應只靠閱讀 Context Engineering,更應該具備 Context Learning 的能力。

      為此,在 4 月 17-18 日的 2026 奇點智能技術大會上,我們誠邀 Macaron AI 首席科學家、Mind Lab Director 馬驍騰帶來一場直擊 Agent 進化本質的深度分享,讓 Agent 從“聽指令”進化到“漲經驗”。


      馬驍騰是誰?

      提到馬驍騰,筆者腦海首先閃現的是強化學習、Agent、1500+……

      作為清華大學自動化系的博士、博士后,馬驍騰在產業界和學術界有著扎實的底蘊。他在強化學習相關領域發表了 30 余篇頂會論文,谷歌學術引用超過 1500 次。

      現在,他是 Macaron AI 首席科學家,也是 Mind Lab 的掌舵人。

      他帶隊研發了面向萬億參數模型的 LoRA-RL 訓練底座—— MinT,成功實現了端到端的萬億參數推理強化學習。

      以萬億參數模型(如 Kimi K2)為例,該系統所需的 GPU 數量僅為傳統全參數 RL 的約 10%。這徹底改變了大模型后訓練的經濟學,使 RL 能夠大規模落地到更多產品和團隊中。(核心解讀:https://macaron.im/mindlab/research/building-trillion-parameter-reasoning-rl-with-10-gpus)


      從 Context Engineering 到 Context Learning:萬億參數大模型的后訓練實戰

      在 2026 奇點智能技術大會上,馬驍騰將帶來 《邁向經驗智能:從 Context Engineering 到 Context Learning》 的深度分享,直擊當前 AI Agent 開發與落地的核心痛點。

      痛點:Prompt 工程的“邊際效應遞減”

      當前的 Agent 開發,陷入了一個“堆砌上下文”的怪圈。

      為了讓 Agent 應對動態環境(比如操作一個不斷更新的 App 界面),工程師們不得不編寫越來越長、越來越復雜的 Prompt。但這帶來了兩個無法回避的問題:

      • 擴展性受限: 人工編排永遠趕不上環境的變化速度;

      • 經驗無法復用: Agent 每次任務都是“從零開始”,上一次的成功或失敗經驗,無法沉淀為模型的能力。

      解法:Context Learning(在交互中學習)

      馬驍騰提出的 Context Learning,核心在于“經驗的內化”。

      通過強化學習,讓模型在真實的交互數據中自主試錯、積累經驗,并將這些經驗刻進模型參數里。

      實戰干貨:MinT 底座與 Macaron AI 案例

      為了證明這條路走得通,馬驍騰將在現場拆解 Mind Lab 的工程實踐:

      • MinT 面向萬億參數模型的 LoRA-RL 訓練底座:支撐高吞吐、低成本的強化學習快速迭代。并以 Macaron AI 模型訓練為案例,展示如何利用 Context Learning 教會模型操作 Dynamic UI,將交互經驗沉淀為可復用的模型能力與訓練管線。

      • Macaron AI 模型案例:用 Context Learning 訓練 Dynamic UI 交互能力

      對于參會者而言,這場分享的直接價值在于:

      • 獲得可落地的 RL Infra 建設思路:了解如何搭建一個像 MinT 這樣,能夠支撐大模型低成本、高吞吐強化學習迭代的基礎設施;

      • 將 Context Learning 從理念變為工程現實的前提;

      • 理解可靠性與適應性的平衡術:明白在什么場景下仍需依賴 Context Engineering 確??煽?,又在什么場景下可以放手讓模型通過 Context Learning 自主進化,從而設計出更健壯、更靈活的 Agent 系統。


      2026 奇點智能技術大會

      馬驍騰的 Context Learning,只是 2026 奇點智能技術大會眾多硬核議題中的一環。

      面對“未來沒有全棧,只有 Agent 工程師”的行業劇變,我們需要的不只是幾場演講,而是一份可被驗證的、成體系的工程經驗。

      4 月 17-18 日,由 CSDN 與 奇點智能研究院聯合主辦的「2026 奇點智能技術大會」 將在上海環球港凱悅酒店隆重召開。

      • 頂尖陣容: 匯聚 50+ 位站在變革最前沿的技術領袖,來自 微軟、BAT、京東、快手等一線大廠;

      • 硬核議題: 覆蓋 Agent 系統、世界模型、AI 原生研發、AI Infra 等 12 大前沿專題。

      這里沒有空泛的預測,只有扎實的復盤與當下的解法與前沿的探索。

      與此同時,2026 奇點智能技術大會同步開放多種合作形式:

      • 技術生態合作伙伴

      • 企業專場共建

      • 行業解決方案聯合展示

      我們期待與更多長期主義者一起,為 AI 時代留下可被驗證、可被復用的工程經驗。


      提前預約 2026 奇點智能技術大會全套 PPT 資料

      官方網站:www.ml-summit.org

      購票熱線:400-821-5876

      購票咨詢:service@boolan.com

      企業合作:partner@boolan.com

      演講申請:hemiao@csdn.net

      媒體聯系:media@boolan.com

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      NBA官宣!東契奇和坎寧安申訴成功!愛德華茲失去評獎資格

      NBA官宣!東契奇和坎寧安申訴成功!愛德華茲失去評獎資格

      籃球教學論壇
      2026-04-17 01:06:53
      特朗普要帶兒子訪華,美企高管喊話全美:絕不能答應中國一件事!

      特朗普要帶兒子訪華,美企高管喊話全美:絕不能答應中國一件事!

      影孖看世界
      2026-04-17 01:17:08
      “指紋鎖”退出中國家庭?開鎖師傅說了實話,我連夜換回了鐵將軍

      “指紋鎖”退出中國家庭?開鎖師傅說了實話,我連夜換回了鐵將軍

      巢客HOME
      2026-04-08 15:48:09
      心源性猝死的人越來越多?醫生強調:寧可打打牌,建議別做這7事

      心源性猝死的人越來越多?醫生強調:寧可打打牌,建議別做這7事

      醫學原創故事會
      2026-03-29 23:50:13
      巴西總統盧拉公開喊話:內馬爾想踢世界杯?先看看C羅梅西怎么做,學不會就別想世界杯

      巴西總統盧拉公開喊話:內馬爾想踢世界杯?先看看C羅梅西怎么做,學不會就別想世界杯

      林子說事
      2026-04-16 19:24:58
      中東三國聯合反擊:驅逐美軍、擁抱中國與巴鐵,挑戰美國霸權!

      中東三國聯合反擊:驅逐美軍、擁抱中國與巴鐵,挑戰美國霸權!

      Ck的蜜糖
      2026-04-17 03:19:13
      江青書信曝光!鋼筆字竟暗藏驚人秘密,書法之爭誰勝出?

      江青書信曝光!鋼筆字竟暗藏驚人秘密,書法之爭誰勝出?

      書畫相約
      2026-04-14 07:21:03
      為什么國際油價跌了20%,國內油價只降5%?

      為什么國際油價跌了20%,國內油價只降5%?

      生命可以承受之輕
      2026-04-16 18:49:12
      蔡正元坐牢頭發全白了?老友邱毅曝探監狀況:很辛苦!

      蔡正元坐牢頭發全白了?老友邱毅曝探監狀況:很辛苦!

      海峽導報社
      2026-04-16 11:04:09
      別再尬演情婦了!一臉疲態、五大三粗,這是迷倒男人該有的皮囊?

      別再尬演情婦了!一臉疲態、五大三粗,這是迷倒男人該有的皮囊?

      小蘭聊歷史
      2026-04-15 12:29:51
      廣西攔路的路霸已被刑事拘留,網友好奇為啥只抓5人

      廣西攔路的路霸已被刑事拘留,網友好奇為啥只抓5人

      映射生活的身影
      2026-04-16 23:47:58
      亞足聯把中國當成東亞最好朋友:2項大賽都想交給中國舉辦!

      亞足聯把中國當成東亞最好朋友:2項大賽都想交給中國舉辦!

      邱澤云
      2026-04-16 14:06:19
      偷雞不成蝕把米!官微內涵趙麗穎秒刪,張萌最后那點體面保不住了

      偷雞不成蝕把米!官微內涵趙麗穎秒刪,張萌最后那點體面保不住了

      橙星文娛
      2026-04-16 10:55:02
      新血糖標準已更新,餐后血糖最佳值不再是6.2,早知早受益

      新血糖標準已更新,餐后血糖最佳值不再是6.2,早知早受益

      荊醫生科普
      2026-04-16 15:24:36
      省委、市委決定:金寧任廣德市委書記

      省委、市委決定:金寧任廣德市委書記

      上觀新聞
      2026-04-16 13:34:03
      國民黨再掀大內斗,兩大部門直接開火,有人包庇“藍皮綠骨”?

      國民黨再掀大內斗,兩大部門直接開火,有人包庇“藍皮綠骨”?

      DS北風
      2026-04-16 19:32:14
      莫迪心寒了!伊朗總統點名感謝中俄六國,唯獨對印一字都不想多提

      莫迪心寒了!伊朗總統點名感謝中俄六國,唯獨對印一字都不想多提

      聞香閣
      2026-04-15 22:13:05
      中國向伊朗提供緊急人道主義援助

      中國向伊朗提供緊急人道主義援助

      新華社
      2026-04-16 23:43:04
      經過伊朗這一戰,中美之間可能至少50年內不會爆發戰爭

      經過伊朗這一戰,中美之間可能至少50年內不會爆發戰爭

      地球記
      2026-04-16 20:21:55
      Lululemon“避孕門”曝光!3億中產天塌了!

      Lululemon“避孕門”曝光!3億中產天塌了!

      廣告案例精選
      2026-04-16 08:28:23
      2026-04-17 04:16:49
      CSDN incentive-icons
      CSDN
      成就一億技術人
      26460文章數 242270關注度
      往期回顧 全部

      科技要聞

      趙明:智駕之戰,看誰在大模型上更高效

      頭條要聞

      特朗普宣布黎以將?;鸷?以軍大規??找u黎巴嫩

      頭條要聞

      特朗普宣布黎以將?;鸷?以軍大規模空襲黎巴嫩

      體育要聞

      皇馬拜仁踢出名局,但最搶鏡的還是他

      娛樂要聞

      絲芭傳媒創始人王子杰去世,享年63歲

      財經要聞

      海爾與醫美女王互撕 換血抗衰誰的生意?

      汽車要聞

      空間大五個乘客都滿意?體驗嵐圖泰山X8

      態度原創

      藝術
      時尚
      家居
      手機
      公開課

      藝術要聞

      你絕對想不到!這幅油畫背后的美麗故事!

      爆火的前額葉梗,讓多少年輕人主動確診「腦殘」?

      家居要聞

      智能舒適 簡約風尚

      手機要聞

      OPPO Find X10:8000mAh超大電池+雙2億影像,中屏機皇實錘!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版