<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      國產(chǎn)AI路由系統(tǒng)開源逆襲!僅用19%成本達(dá)到Gemini-2.5-Pro同性能

      0
      分享至

      Avengers-Pro團(tuán)隊 投稿
      量子位 | 公眾號 QbitAI

      頂級大模型性能確實很強(qiáng),但對于預(yù)算不高的用戶來說就是:

      你很好但我不配。

      雖然大模型的優(yōu)越表現(xiàn)令人矚目,但動輒高昂的使用成本也讓不少用戶望而卻步。

      為平衡性能與成本,上海人工智能實驗室科研團(tuán)隊基于前期技術(shù)積累,開源推出了Avengers-Pro多模型調(diào)度路由方案。



      該方案集成了8個行業(yè)領(lǐng)先的大模型,并在Human Last Exam、GPQA-diamond、ARC-AGI等6個挑戰(zhàn)性數(shù)據(jù)集上取得了優(yōu)秀成績:

      1. 性能新高:Avengers-Pro的最高性能超越GPT-5-medium 7%,超越Gemini-2.5-Pro 19%。
      2. 極致性價比:Avengers-Pro能以降低27%成本的方式,達(dá)到與GPT-5-medium同等的頂級性能;更能以僅19%的成本,獲得Gemini-2.5-Pro同等的性能水平。
      3. 帕累托最優(yōu):相比單個模型,Avengers-Pro在任何給定成本水平下都能實現(xiàn)最高準(zhǔn)確率;反之,針對任何指定的準(zhǔn)確率目標(biāo),也能將成本降至最低,實現(xiàn)了性能-成本平衡的帕累托最優(yōu)解。



      來看看是如何做到的。

      比GPT-5更強(qiáng),更便宜

      研究背景:大模型的智能調(diào)度路由

      如何平衡大模型的性能表現(xiàn)和推理成本是大模型領(lǐng)域的關(guān)鍵問題。

      在已經(jīng)被優(yōu)化到極致的大模型系統(tǒng)的基礎(chǔ)上進(jìn)一步提升性價比的挑戰(zhàn)性不言而喻。

      為解決這一問題,大模型智能調(diào)度路由應(yīng)運而生。其核心思想是將不同任務(wù)分配給最適合的大模型,以提升模型回復(fù)質(zhì)量,同時避免”大炮打蚊子“而產(chǎn)生的資源浪費。

      OpenAI在最新推出的GPT-5中,首次在商業(yè)模型中引入的多模型調(diào)度路由機(jī)制:

      在推理階段,系統(tǒng)會根據(jù)任務(wù)特性和用戶需求,動態(tài)切換低成本低性能模型與高成本強(qiáng)推理模型,實現(xiàn)性能與成本的靈活平衡。

      這表明GPT-5會通過一個實時的路由器(Router)來動態(tài)決策,可以在保證絕大多數(shù)問題得到高效解答的同時,將復(fù)雜、困難的推理任務(wù)交給能力更強(qiáng)的模型處理,從而在系統(tǒng)層面實現(xiàn)性能與陳本的最佳平衡。

      Avengers-Pro多模型調(diào)度路由方案則是對GPT-5多模型調(diào)度路由機(jī)制的進(jìn)一步拓展。

      Avengers-Pro: 兼顧性能與成本,推動降本增效

      Avengers-Pro實現(xiàn)了對不同性能與成本的大模型進(jìn)行統(tǒng)一集成與調(diào)度路由,為性能與成本的權(quán)衡提供了一站式解決方案,有效推動了大模型的降本增效。

      其核心機(jī)制是通過對用戶請求進(jìn)行嵌入(embedding)和聚類(clustering)分析,動態(tài)匹配并分配最適合的模型來處理不同任務(wù)

      只需依靠少量用戶請求-答案標(biāo)簽數(shù)據(jù),Avengers-Pro框架主要包括以下三個核心步驟:

      1. 嵌入 (Embedding): 首先,該框架使用文本嵌入模型將用戶請求轉(zhuǎn)換成高維向量,捕捉其深層語義信息。
      2. 聚類 (Clustering): 接著,該框架將這些語義向量進(jìn)行聚類,將相似的問題或任務(wù)歸為一個團(tuán)簇。這使得系統(tǒng)能夠理解不同類型任務(wù)的共性,例如“物理知識問答”、“網(wǎng)頁制作代碼生成”等。
      3. 評分(Scoring): 該框架會預(yù)先在每個聚類所得到的團(tuán)簇(即每類任務(wù))上評估模型池中所有模型的性能和成本。基于一個可調(diào)節(jié)的性能-成本權(quán)衡參數(shù)α,系統(tǒng)為每個模型在個團(tuán)簇上計算一個性能-成本綜合評分。

      推理時,Avengers-Pro框架會首先將其歸類到最相關(guān)的聚類中,并結(jié)合各模型在該聚類上的性能-成本綜合評分,將請求動態(tài)分配給得分最高的模型。

      通過調(diào)整參數(shù)α(范圍在0到1之間),系統(tǒng)可以在追求極致性能(α=1)與極致性價比(α=0)之間靈活切換,滿足不同應(yīng)用場景下對性能與成本的多樣化需求。

      實驗表現(xiàn):Avengers-Pro比GPT-5更強(qiáng),更便宜

      在實驗中,Avengers-Pro集成了來自4個廠家的8個業(yè)界頂尖模型:

      1. OpenAI:GPT-5-chat, GPT-5-medium;
      2. Anthropic:Claude-4.1-opus, Claude-4-sonnet;
      3. Google:Gemini-2.5-pro, Gemini-2.5-flash;
      4. 阿里: Qwen3-235B-A22B-thinking-2507, Qwen3-235B-A22B-2507。

      評測場景由6個極具挑戰(zhàn)性的數(shù)據(jù)集組成: GPQA-Diamond, Human’s Last Exam, ARC-AGI, SimpleQA, LiveCodeBench, τ2-bench,覆蓋了代碼生成、科學(xué)推理、智能體應(yīng)用等。

      Avengers-Pro的整體性能優(yōu)于任意單一模型。當(dāng)權(quán)衡系數(shù)傾向于追求性能時,Avengers-Pro的平均正確率為0.66。

      相比之下,模型池中最強(qiáng)的單一模型GPT-5-medium的平均正確率為0.62。也就是說,Avengers-Pro即使與當(dāng)前性能最強(qiáng)的單模型對比,仍然實現(xiàn)了7%的性能提升。

      Avengers-Pro實現(xiàn)了性能-成本平衡,形成了帕累托前沿。通過靈活調(diào)整性能-成本權(quán)衡系數(shù),當(dāng)Avengers-Pro與GPT-5-medium性能持平時,能夠節(jié)省高達(dá)27%的成本。

      如果僅需達(dá)到GPT-5-medium 90%的性能,成本更是可降至僅37%。

      而在追求與Gemini-2.5-Pro相當(dāng)?shù)男阅軙r,Avengers-Pro甚至只需19%的超低成本即可實現(xiàn)。

      并且,Avengers-Pro在任何給定的成本水平上,都能提供最高的準(zhǔn)確率;反之,對于任何給定的準(zhǔn)確率目標(biāo),都能將成本控制在最低。



      性能-成本權(quán)衡系數(shù)的影響:

      對性能-成本平衡系數(shù)的分析顯示,隨著系數(shù)從0逐漸提升到1(追求性能),模型的性能和成本均逐步上升。



      模型選擇:

      在不同的性能-成本權(quán)衡系數(shù)下,Avengers-Pro能夠根據(jù)不同模型的性能成本靈活進(jìn)行任務(wù)分配。

      當(dāng)系數(shù)更傾向于成本時,Qwen族的模型由于其較低的成本會被更多選擇。

      而當(dāng)系數(shù)更傾向于性能時,GPT-5-medium這一性能相對較強(qiáng)的模型會被更多選擇。

      在集成了多個大模型后,調(diào)度路由能實現(xiàn)大模型的降本增效:在性能上超越了模型池中最強(qiáng)的單一模型,并且在保證相同性能的情況下,能顯著降低成本。

      此外,面對不同的性能與成本權(quán)衡需求,可針對不同任務(wù),靈活自動選擇最合適的模型,全面滿足多樣化的應(yīng)用場景。

      Avergers-Pro證明了在當(dāng)前大模型生態(tài)下,智能調(diào)度路由方案的突出表現(xiàn)和巨大潛力。

      智能路由理念也將在未來大模型應(yīng)用中帶來更多突破與驚喜。

      論文地址:https://arxiv.org/abs/2508.12631
      GitHub地址:https://github.com/ZhangYiqun018/AvengersPro

      — 完 —

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      房產(chǎn)稅的前身“房屋養(yǎng)老金”要來了,博主分析:明年的二手房慘了

      房產(chǎn)稅的前身“房屋養(yǎng)老金”要來了,博主分析:明年的二手房慘了

      三言四拍
      2025-12-17 11:43:14
      國家隊救市了!市場大逆轉(zhuǎn)!

      國家隊救市了!市場大逆轉(zhuǎn)!

      販財局
      2025-12-17 15:04:33
      純電生死戰(zhàn),打掉理想千億市值

      純電生死戰(zhàn),打掉理想千億市值

      市值榜
      2025-12-16 13:11:59
      南京博物院館藏明代《江南春》現(xiàn)身拍賣市場,捐贈者后人起訴博物館:為何多幅名畫“消失”

      南京博物院館藏明代《江南春》現(xiàn)身拍賣市場,捐贈者后人起訴博物館:為何多幅名畫“消失”

      澎湃新聞
      2025-12-17 08:16:28
      10個讓身體越來越好的方法,不是跑步!99%的人不知道

      10個讓身體越來越好的方法,不是跑步!99%的人不知道

      神奇故事
      2025-12-06 21:52:15
      逆天了!印度人又在新西蘭造假,選票全部作廢!史上首次,徹底曝光

      逆天了!印度人又在新西蘭造假,選票全部作廢!史上首次,徹底曝光

      發(fā)現(xiàn)新西蘭
      2025-12-17 11:52:45
      日本議員曝光,高市早苗拋開事先準(zhǔn)備的材料,強(qiáng)行輸出涉臺謬論

      日本議員曝光,高市早苗拋開事先準(zhǔn)備的材料,強(qiáng)行輸出涉臺謬論

      合贊歷史
      2025-12-17 14:51:13
      演員張澍:許亞軍為她放棄買第二套房子,何晴兒子對她稱呼太有愛

      演員張澍:許亞軍為她放棄買第二套房子,何晴兒子對她稱呼太有愛

      古希臘掌管月桂的神
      2025-12-17 19:24:57
      芬蘭總理正式向中韓日民眾道歉:“種族主義和歧視在芬蘭沒有立足之地”

      芬蘭總理正式向中韓日民眾道歉:“種族主義和歧視在芬蘭沒有立足之地”

      環(huán)球網(wǎng)資訊
      2025-12-17 22:36:37
      泰國定義柬埔寨園區(qū)為“犯罪團(tuán)伙”,國人卻稱他們?yōu)椤半娫p人員”

      泰國定義柬埔寨園區(qū)為“犯罪團(tuán)伙”,國人卻稱他們?yōu)椤半娫p人員”

      清書先生
      2025-12-17 17:32:36
      柬軍遭火力壓制,洪森押上三大賭注

      柬軍遭火力壓制,洪森押上三大賭注

      戎評
      2025-12-17 16:09:11
      價格大跳水!暴跌30%,進(jìn)口車跌落神壇,廣東“老錢車”銷量逆襲

      價格大跳水!暴跌30%,進(jìn)口車跌落神壇,廣東“老錢車”銷量逆襲

      品牌觀察官
      2025-12-16 20:52:08
      全網(wǎng)瘋傳的江門大瓜,年度最復(fù)雜的家庭倫理關(guān)系

      全網(wǎng)瘋傳的江門大瓜,年度最復(fù)雜的家庭倫理關(guān)系

      杭城村叔
      2025-12-17 21:01:23
      周柯宇成魏大勛2.0!狗仔曝?zé)岵〗愕軕僬嬲劻耍P(guān)鍵在游戲雙排

      周柯宇成魏大勛2.0!狗仔曝?zé)岵〗愕軕僬嬲劻耍P(guān)鍵在游戲雙排

      萌神木木
      2025-12-17 17:37:43
      一夜之間有關(guān)大師的文章正在被全網(wǎng)刪除,答案或許就在這里!

      一夜之間有關(guān)大師的文章正在被全網(wǎng)刪除,答案或許就在這里!

      清哲木觀察
      2025-12-17 10:59:57
      4-0!中國隊罕見大勝,全場壓著打,首次出線有戲,劍指亞洲杯8強(qiáng)

      4-0!中國隊罕見大勝,全場壓著打,首次出線有戲,劍指亞洲杯8強(qiáng)

      侃球熊弟
      2025-12-17 19:48:44
      31省份出生人口數(shù)量一覽,最能生娃省份排名來了

      31省份出生人口數(shù)量一覽,最能生娃省份排名來了

      第一財經(jīng)資訊
      2025-12-17 16:58:59
      禁開燃油車接送學(xué)生?河南一地學(xué)校通知惹眾議,官方回應(yīng)遭質(zhì)疑

      禁開燃油車接送學(xué)生?河南一地學(xué)校通知惹眾議,官方回應(yīng)遭質(zhì)疑

      Mr王的飯后茶
      2025-12-17 20:38:28
      她真的好慘!被導(dǎo)演打到腦震蕩、毀容,捂嘴窒息,最后反而被封殺

      她真的好慘!被導(dǎo)演打到腦震蕩、毀容,捂嘴窒息,最后反而被封殺

      小熊侃史
      2025-12-16 07:05:07
      悲催!深圳一35年港資工廠結(jié)業(yè),將依法核算支付工資、經(jīng)濟(jì)補(bǔ)償…

      悲催!深圳一35年港資工廠結(jié)業(yè),將依法核算支付工資、經(jīng)濟(jì)補(bǔ)償…

      火山詩話
      2025-12-17 19:11:05
      2025-12-18 07:52:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動態(tài)
      11869文章數(shù) 176338關(guān)注度
      往期回顧 全部

      科技要聞

      Gemini3 Flash來了:性能不輸Pro 成本僅1/4

      頭條要聞

      馬克龍發(fā)文:歐盟必須對中國開放 但有個前提

      頭條要聞

      馬克龍發(fā)文:歐盟必須對中國開放 但有個前提

      體育要聞

      短短一年,從爭冠到0勝墊底...

      娛樂要聞

      狗仔曝?zé)岵〗愕軕僬嬲劻耍浚浚?/h3>

      財經(jīng)要聞

      重大改革,身關(guān)14億人的政策徹底變了!

      汽車要聞

      一車多動力+雙姿態(tài) 長城歐拉5上市 限時9.18萬元起

      態(tài)度原創(chuàng)

      時尚
      健康
      本地
      教育
      公開課

      你算老幾?我算老己!

      這些新療法,讓化療不再那么痛苦

      本地新聞

      云游安徽|踏過戰(zhàn)壕與石板,讀一部活的淮北史

      教育要聞

      影響成績好壞的因素都有哪些?

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 欧美偷拍视频| 欧美成人天堂| 野花社区视频www官网| 人禽杂交18禁网站免费| 国产免费AV片在线看| 日本熟妇色| 97色婷婷| 亚洲毛多水多男女| 亚洲欧美v国产蜜芽tv| 久久国产亚洲精品无码| 亚洲一区二区AV| 阜宁县| 国产麻豆剧传媒精品国产av| 亚洲欧美成人精品香蕉网| 久久久久人妻精品一区三寸| 国产又大又粗| 国产人妻人伦精品一区二区| 日本丶国产丶欧美色综合| 亚洲色婷婷一区二区| 蜜桃人妻无码AV天堂二区| 嘉荫县| 五月婷婷激情第四季| 18禁无遮挡啪啪无码网站 | 一级AV韩国| 乱人伦??国语对白| 无码中文字幕人妻在线一区二区三区 | 亚洲av一本二本三本| 丁香婷婷社区| 人妻少妇久久中文字幕| 专干老熟女视频在线观看| 久久久久久久久久8888| 狠狠躁天天躁日日躁97| 欧洲熟妇色xxxx欧美老妇免费 | 精品国产污污免费网站| 亚洲成人影片| 中文字幕?自拍| 91无码人妻一区二区成人aⅴ| 大地资源中文第三页| 亚洲欧洲∨国产一区二区三区| 黑人AV无码| 欧美肥妇毛多水多bbxx|