<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      英偉達巧用8B模型秒掉GPT-5,開源了

      0
      分享至

      英偉達端著一個8B小模型對GPT-5說:

      不好意思,你還得練(bushi)。

      何出此言?——英偉達攜手香港大學開源的Orchestrator-8B,人類終極考試HLE分數更高、花錢更少、跑起來速度還更快。



      哦對了,還在HuggingFace被狂贊,沖到了熱門模型前五。



      而它超越GPT-5的打法是不當推理者,而是“工具主理人”,協調使用各路工具。

      如何吊打GPT-5?

      人在解決問題時會找各種幫手,比如搜索引擎、計算器 ,那這個工作能不能由模型代勞?

      Orchestrator干的就是這事兒。

      雖然自己只有8B參數,但手下管著一整個工具團隊。

      既有GPT-5、Claude Opus 4.1這樣的頂級大模型,也有Qwen2.5-Math這樣的專業數學工具,還有網頁搜索、本地檢索、代碼解釋器這些實用小幫手。



      它并不是自己解題,而是判斷現在該用哪個工具、控制工具的順序和使用次數、還能兼顧效果、成本、用戶偏好,工作日常如下:

      • 拿到難題先分析:這題需要算數學?那就調用Qwen2.5-Math;
      • 過程中動態調整:搜完資料發現需要驗證?那就先用代碼解釋器跑一遍;
      • 全程把控用戶偏好:用戶說要省錢,那GPT-5能不用就不用,優先用本地工具。

      簡單說,大模型是一個人干所有活,而Orchestrator-8B是帶著團隊干專業活。



      能讓小模型精準協調這么多工具,全靠英偉達的ToolOrchestra訓練大法。

      核心有兩個,一個是有獎有罰的強化學習,一個是量身定制的ToolScale數據集

      訓練時給Orchestrator立了三條獎懲規則:

      • 效果獎:讓GPT-5判對錯,解題對了加分,錯了扣分;
      • 效率獎:用的錢少、耗時短加分,反之扣分;
      • 偏好獎:聽用戶的話加分,比如用戶要隱私保護,多用本地搜索就加分。

      研究者建了個包含金融、醫療、電商、旅游等10個領域的訓練素材庫,里面全是“怎么用工具解題”的案例,讓模型充分接觸各類場景。

      Orchestrator-8B也在權威測試中交出了令人滿意的答卷。



      HLE測試里它拿下37.1%的得分,超過GPT-5的35.1%,成本卻僅為后者的1/2.5;



      FRAMES、τ2-Bench測試中也拿下SOTA成績,降低了開支,運行速度更是快了一倍多。

      小模型的逆襲

      實際上,在AI領域工具編排和小模型驅動復合系統的賽道上,英偉達ToolOrchestra訓練的Orchestrator-8B并非孤例。

      最早探索讓小模型學會調用工具的代表性研究,是谷歌DeepMind在2023年提出的Toolformer,通過監督學習+自生成數據,讓12B參數的模型學會調用計算器、翻譯API、搜索引擎等基礎工具;

      但當時,Toolformer僅聚焦基礎工具,并沒有把大模型納入工具庫。

      MIT和CMU聯合團隊的ToolRL,提出以獎勵為核心的工具學習框架,訓練小模型通過強化學習動態選擇工具,主要是解決“傳統工具學習過度依賴人工標注數據” 的問題,通過自動生成工具交互軌跡訓練模型。

      雖然也是獎勵機制,但ToolRL的獎勵函數更側重于任務的正確性和工具調用效率,并沒有明確納入用戶偏好,且工具庫以基礎工具和專業API為主。

      今年,香港大學和微軟提出的Optimal Tool Calls(OCT),也是專門針對“工具調用成本優化”的小模型訓練方法。

      越來越多的團隊在做相關研究,也有越來越多的人關注該領域的進展。

      就拿Orchestrator-8B來說,為什么它能獲得HuggingFace高贊?

      最明顯的原因就是實用。大模型雖強,但太貴、太慢,而Orchestrator-8B參數量小,還能實現「強+省錢」,直接解決了落地時的成本難題。

      用低成本實現高智能,這么一看,AI的未來還真不一定是超級大模型單打獨斗了。

      作者簡介

      Orchestrator-8B這篇論文的一作是香港大學博士蘇弘錦,主要研究方向是數據科學和自然語言處理,現在英偉達實習。



      共一是英偉達研究院的研究科學家Shizhe Diao,主要進行大型基礎模型的預訓練、高效調優和對齊方面的研究,曾與字節跳動人工智能實驗室的李航博士合作。



      論文地址:https://arxiv.org/abs/2511.21689
      項目主頁:https://research.nvidia.com/labs/lpr/ToolOrchestra/
      數據集:https://huggingface.co/datasets/nvidia/ToolScale
      HuggingFace地址:https://huggingface.co/nvidia/Nemotron-Orchestrator-8B

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      勇士隊老板迅速回應球迷憤怒的郵件,暗示庫明加與勇士之間存矛盾

      勇士隊老板迅速回應球迷憤怒的郵件,暗示庫明加與勇士之間存矛盾

      好火子
      2025-12-17 07:13:56
      撒貝寧夫妻開300萬大G接娃!加拿大岳父罕見露面,一家三代超溫馨

      撒貝寧夫妻開300萬大G接娃!加拿大岳父罕見露面,一家三代超溫馨

      愛下廚的阿釃
      2025-12-17 06:42:05
      郭碧婷一家4口團聚,向佐陪岳父遛彎盡孝心,3歲兒子騎爸爸脖子上

      郭碧婷一家4口團聚,向佐陪岳父遛彎盡孝心,3歲兒子騎爸爸脖子上

      心靜物娛
      2025-12-17 09:51:52
      北約給中國戰機取代號:殲20代號“Fagin”,音譯過來很惡毒

      北約給中國戰機取代號:殲20代號“Fagin”,音譯過來很惡毒

      云上烏托邦
      2025-12-16 13:18:23
      物業不催費了?不是良心發現,而是新規這3條紅線,讓物業不敢動

      物業不催費了?不是良心發現,而是新規這3條紅線,讓物業不敢動

      我心縱橫天地間
      2025-11-29 22:15:54
      “4斤黃金鳳冠被毀”大反轉,千萬級網紅天塌了!

      “4斤黃金鳳冠被毀”大反轉,千萬級網紅天塌了!

      廣告案例精選
      2025-12-16 11:07:45
      淚崩!蔡康永談大S:我以為大S會活得比我們久,結果她提前下車了

      淚崩!蔡康永談大S:我以為大S會活得比我們久,結果她提前下車了

      未小沫
      2025-12-16 23:20:42
      醫生研究:能抗擊慢性炎癥的事情,不是運動!而是3個生活習慣

      醫生研究:能抗擊慢性炎癥的事情,不是運動!而是3個生活習慣

      小胡軍事愛好
      2025-12-16 22:05:58
      太猖狂了!張本接受采訪,竟然引用高市早苗話,網友:找死的節奏

      太猖狂了!張本接受采訪,竟然引用高市早苗話,網友:找死的節奏

      金山話體育
      2025-12-16 16:04:32
      43歲rain現身沙田馬場,西裝難掩肌肉線條,零距離懟臉歲月無痕

      43歲rain現身沙田馬場,西裝難掩肌肉線條,零距離懟臉歲月無痕

      動物奇奇怪怪
      2025-12-17 01:24:41
      昆明一公園內明永歷帝雕塑趴泥中引爭議!有游客稱感到不適要求改變,公園回應:已在著手處理

      昆明一公園內明永歷帝雕塑趴泥中引爭議!有游客稱感到不適要求改變,公園回應:已在著手處理

      臺州交通廣播
      2025-12-16 22:38:07
      一醫生實名舉報醫院全員吃回扣!舉報信“貼滿”醫院......

      一醫生實名舉報醫院全員吃回扣!舉報信“貼滿”醫院......

      醫脈圈
      2025-12-16 20:42:16
      一部電影八個演員title,內娛的番位造詞還能更離譜嗎?

      一部電影八個演員title,內娛的番位造詞還能更離譜嗎?

      鈦媒體APP
      2025-12-15 18:57:25
      中央定調,2026年養老金調整有望?工齡對漲幅影響越來越小?

      中央定調,2026年養老金調整有望?工齡對漲幅影響越來越小?

      王五說說看
      2025-12-17 09:53:40
      朝鮮據稱拒絕俄羅斯再向俄烏戰場派遣士兵的請求,只因錢沒到位?

      朝鮮據稱拒絕俄羅斯再向俄烏戰場派遣士兵的請求,只因錢沒到位?

      之乎者也小魚兒
      2025-12-15 15:18:45
      《阿凡達3》避坑指南,頂配版本兩個選擇,IMAX絕非最佳

      《阿凡達3》避坑指南,頂配版本兩個選擇,IMAX絕非最佳

      光影新天地
      2025-12-16 16:35:20
      趙雅芝為了賺錢真是“不要命了”,72歲竟然穿20厘米的高跟鞋!

      趙雅芝為了賺錢真是“不要命了”,72歲竟然穿20厘米的高跟鞋!

      小娛樂悠悠
      2025-12-17 09:27:59
      荷蘭公開宣布制裁中國,各個公司芯片受損,中國反應令人意想不到

      荷蘭公開宣布制裁中國,各個公司芯片受損,中國反應令人意想不到

      歷史求知所
      2025-12-16 09:15:06
      明年1月1日起:每畝補貼3000元?一戶一田定了!土地歸并最新消息? 土地承包整省試點來了!你...

      明年1月1日起:每畝補貼3000元?一戶一田定了!土地歸并最新消息? 土地承包整省試點來了!你...

      新浪財經
      2025-12-17 04:48:41
      一球迷向勇士老板發郵件要求引進第二得分點,后者共情回復并安撫

      一球迷向勇士老板發郵件要求引進第二得分點,后者共情回復并安撫

      懂球帝
      2025-12-17 08:25:12
      2025-12-17 10:40:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      11864文章數 176339關注度
      往期回顧 全部

      科技要聞

      無人駕駛邁關鍵一步 特斯拉股價觸歷史新高

      頭條要聞

      牛彈琴:特朗普下狠手BBC面臨生死存亡 英國人急壞了

      頭條要聞

      牛彈琴:特朗普下狠手BBC面臨生死存亡 英國人急壞了

      體育要聞

      短短一年,從爭冠到0勝墊底...

      娛樂要聞

      鞠婧祎收入曝光,絲芭稱已支付1.3億

      財經要聞

      "祥源系"爆雷 有投資者數百萬元無法提現

      汽車要聞

      一車多動力+雙姿態 長城歐拉5上市 限時9.18萬元起

      態度原創

      藝術
      教育
      手機
      數碼
      公開課

      藝術要聞

      雷軍前腳剛曬完“低速防碰撞”功能,后腳就撞上銷售!網友:“法務說沒寫進合同不算”含金量還在上升

      教育要聞

      很多人瞧不上高校行政,其實它是“金餑餑” ,很多人不知道

      手機要聞

      消息稱小米17 Ultra徠卡特別版手機啟用雙品牌

      數碼要聞

      LG MicroRGB Evo電視將于CES 2026首發 正面迎戰三星

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 欧洲熟妇色xxxxx欧美老妇伦| 亚洲国产欧洲精品路线久久| 扒开双腿疯狂进出爽爽爽| 国产成人91| 国产色无码专区在线观看| 成在线人av免费无码高潮喷水 | 狠狠色成人| 国产精品日本一区二区在线播放| AV一区二区三区| 久久久夜色精品亚洲| 国产日韩一区二区三区在线观看 | 第一福利导航视频| 高中生粉嫩无套第一次| 国产区图片区小说区亚洲区| 91人妻丰满熟妇Aⅴ无码| 亚洲成av人片大线观看| 99re国产| 日本免费一区二区三区最新vr| 国产天美传媒性色av| 日本一区三区高清视频| 熟女视频在线观看| 夜干夜| 国产色视频一区二区三区| 亚洲无线一二三四区手机| 18禁无遮挡免费视频网站| 久久久久久久av| 大悟县| 风流少妇一区二区三区91| 国产一区二区三区高清在线观看| 老色69久久九九精品高潮| 欧美A√| 另类小说av| 欧美成人aaa片一区国产精品| 高清国产一区二区无遮挡| 久久久久久久AV| 四虎成人精品在永久免费| 丁香婷婷综合激情五月色| 国产a网站| 亚洲中文字幕无码爆乳av| 色窝窝无码一区二区三区 | 91视频免费看|