<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      登頂SuperCLUE DeepSearch,openPangu-R-72B深度搜索能力躍升

      0
      分享至

      機(jī)器之心發(fā)布

      機(jī)器之心編輯部

      隨著大模型推理和 Agent 工具調(diào)用能力的快速發(fā)展,其通過反復(fù)搜索處理復(fù)雜信息需求的效果愈發(fā)受到業(yè)界關(guān)注。近日,第三方評(píng)測(cè)機(jī)構(gòu) SuperCLUE 發(fā)布 11 月 DeepSearch 評(píng)測(cè)報(bào)告,國產(chǎn)大模型 openPangu-R-72B 憑借在長鏈推理、復(fù)雜信息檢索領(lǐng)域的卓越表現(xiàn),在模型榜單中名列第一,體現(xiàn)了基于國產(chǎn)昇騰算力的大模型研發(fā)實(shí)力。



      這款 MoE 架構(gòu)模型,究竟藏著哪些技術(shù)秘密,能在激烈競(jìng)爭(zhēng)中脫穎而出?

      硬核技術(shù)底座:

      MoE 架構(gòu)下的效率與性能平衡術(shù)

      openPangu-R-72B 為考慮效率和性能平衡,重新設(shè)計(jì)了模型底座架構(gòu)。作為基于昇騰集群訓(xùn)練的 MoE(混合專家)模型,它采用 80 選 8 的專家選擇機(jī)制,在 74B 總參數(shù)量的基礎(chǔ)上,將激活參數(shù)量控制在 15B,既保留了大模型的復(fù)雜推理能力,又有效降低了計(jì)算開銷。24T tokens 的訓(xùn)練數(shù)據(jù)與 128k 長序列處理能力,為其處理深度搜索任務(wù)中的長文本信息奠定了基礎(chǔ)。

      為實(shí)現(xiàn)穩(wěn)定收斂與效果提升,openPangu 團(tuán)隊(duì)在預(yù)訓(xùn)練技術(shù)上完成了以下優(yōu)化。



      圖. openPangu-R-72B 模型架構(gòu)

      1)注意力機(jī)制層面引入?yún)?shù)式 Sink Token 技術(shù):有效緩解了極大激活值問題,不僅提升了訓(xùn)練過程的穩(wěn)定性,也對(duì)后續(xù)量化更加親和;

      2)采用 K-Norm 與 Depth-Scaled Sandwich-Norm 組合的架構(gòu),其中 K-Norm 僅對(duì) attention 的 key 施加 RMS Norm,在達(dá)到與 QK-Norm 相當(dāng)穩(wěn)定性的同時(shí),降低計(jì)算開銷,還保留了 Query 更靈活的表達(dá)能力。

      3)注意力架構(gòu)的優(yōu)化兼顧了精度與效率:通過增加 Query 頭數(shù)和注意力頭維度,讓模型能從更多角度捕獲細(xì)粒度語義關(guān)系;引入 Partial RoPE 機(jī)制,僅對(duì) Query 和 Key 中 1/3 維度應(yīng)用位置編碼。通過將 KV 組數(shù)量減半,在 Key 頭維度增加的情況下,仍實(shí)現(xiàn)了 37.5% 的 KV cache 縮減,平衡了推理階段的顯存占用、速度與模型效果。

      4)Adaptive Aux Free 負(fù)載優(yōu)化技術(shù):Aux free 升級(jí)版本,通過自適應(yīng)調(diào)整各個(gè)專家負(fù)載 bias 的更新幅度,有效減少均衡震蕩,讓專家負(fù)載分布更均衡。

      DeepSearch 專項(xiàng)突破:

      三大優(yōu)化破解復(fù)雜搜索難題

      如果說技術(shù)底座是基礎(chǔ),那么針對(duì)深度搜索任務(wù)的后訓(xùn)練優(yōu)化則是 openPangu-R-72B 登頂?shù)年P(guān)鍵。深度搜索作為大模型訪問互聯(lián)網(wǎng)獲取深度信息的核心能力,其長鏈推理與工具調(diào)用水平直接決定模型的實(shí)用價(jià)值。openPangu-R-72B 通過后訓(xùn)練階段進(jìn)行長鏈難題合成、非索引信息處理、快慢思考融合三大策略,顯著提升了模型 DeepSearch 能力。



      圖.openPangu-R-72B 模型深度搜索任務(wù)執(zhí)行流程,該流程同時(shí)用于模型訓(xùn)練和評(píng)測(cè)

      1)在長鏈 QA 難題合成方面,openPangu 團(tuán)隊(duì)在 DeepDiver-V2 和 WebExplorer 技術(shù)基礎(chǔ)上,通過 query 條件模糊化將問題平均難度提升 10%,同時(shí)借鑒《Pushing Test-Time Scaling Limits of Deep Search with Asymmetric Verification》工作的思想,引入 verification agent,大幅提升用于訓(xùn)練問答對(duì)的準(zhǔn)確性,讓模型在復(fù)雜推理場(chǎng)景中 “見多識(shí)廣”。

      2)針對(duì)傳統(tǒng)搜索引擎難以覆蓋的非索引知識(shí)問答 —— 如官網(wǎng)附件中的財(cái)務(wù)數(shù)據(jù)、學(xué)術(shù)論文引文信息獲取等場(chǎng)景,模型訓(xùn)練過程中注入了 “Planner 聚焦關(guān)鍵 URL+ URL_crawler 爬取網(wǎng)頁 + Document_QA 識(shí)別下一步瀏覽鏈接” 的循環(huán)工作流,通過同一站點(diǎn)內(nèi)的多跳瀏覽實(shí)現(xiàn)了深度信息搜集,突破了傳統(tǒng)搜索引擎的信息邊界。

      3)步驟級(jí)快慢融合策略則讓模型的 “思考” 更具效率。DeepSearch 的 ReACT 執(zhí)行過程中,不同步驟的思考強(qiáng)度差異顯著 ——Document_QA 需分析海量網(wǎng)頁數(shù)據(jù)與表格,對(duì)推理精度要求更高;而普通工具調(diào)用步驟更側(cè)重效率。為此,模型為不同步驟匹配不同思考模式:Document_QA 啟用慢思考保障精度,其他步驟采用快思考提升速度,實(shí)現(xiàn)了精度與效率的平衡。

      國產(chǎn)算力賦能:

      openPangu 系列模型彰顯集群優(yōu)勢(shì)

      此次 SuperCLUE DeepSearch 評(píng)測(cè)登頂,不僅是 openPangu-R-72B 模型能力的體現(xiàn),也彰顯了國產(chǎn)算力與大模型研發(fā)深度融合的成效。作為基于昇騰集群訓(xùn)練的代表模型,openPangu-R-72B 證明了國產(chǎn)算力平臺(tái)在支撐大參數(shù)量、高復(fù)雜度模型研發(fā)方面的堅(jiān)實(shí)能力。

      值得關(guān)注的是,openPangu-R-72B 的兄弟模型openPangu-718B在同期 SuperCLUE 通用榜單中斬獲第二名,展現(xiàn)了該系列在不同任務(wù)場(chǎng)景下的全面實(shí)力。從深度搜索的 “單點(diǎn)突破” 到通用能力的 “全面開花”,openPangu 系列正以昇騰算力為根基,為國產(chǎn)大模型生態(tài)注做出更多貢獻(xiàn)。

      隨著大模型在企業(yè)服務(wù)、學(xué)術(shù)研究、政務(wù)處理等領(lǐng)域的深度落地,深度搜索能力將成為模型實(shí)用化的核心競(jìng)爭(zhēng)力。未來,隨著 openPangu 系列模型的持續(xù)迭代,我們期待國產(chǎn)大模型在更多全球頂級(jí)評(píng)測(cè)中綻放光彩。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      臉腫油膩就別演都市劇!41歲朱珠一出手,讓觀眾看清劉亦菲有多強(qiáng)

      臉腫油膩就別演都市劇!41歲朱珠一出手,讓觀眾看清劉亦菲有多強(qiáng)

      胡一舸南游y
      2025-11-17 17:30:51
      從上海電視臺(tái)消失的主持人,曾經(jīng)是一代人的美好記憶

      從上海電視臺(tái)消失的主持人,曾經(jīng)是一代人的美好記憶

      尋途
      2025-12-17 14:04:05
      不知道若是日本人看了這張照片,是不是會(huì)羞愧的臉都沒地方藏?

      不知道若是日本人看了這張照片,是不是會(huì)羞愧的臉都沒地方藏?

      深度報(bào)
      2025-08-04 22:26:35
      假如楊鳴沒那么激動(dòng)沒那么搶戲,會(huì)不會(huì)后面的比賽結(jié)果就不同呢

      假如楊鳴沒那么激動(dòng)沒那么搶戲,會(huì)不會(huì)后面的比賽結(jié)果就不同呢

      余飩搞笑段子
      2025-12-19 02:24:46
      22年世界杯奪冠3周年,阿根廷國家隊(duì)曬圖:三年,三顆星

      22年世界杯奪冠3周年,阿根廷國家隊(duì)曬圖:三年,三顆星

      懂球帝
      2025-12-18 11:18:56
      為什么廣東很少“伏弟魔”?一網(wǎng)友回答讓人哭笑不得

      為什么廣東很少“伏弟魔”?一網(wǎng)友回答讓人哭笑不得

      另子維愛讀史
      2025-12-18 20:57:59
      圖片報(bào):多特想簽巴爾德佩尼亞斯頂替聚勒,藥廠和槍手也有意

      圖片報(bào):多特想簽巴爾德佩尼亞斯頂替聚勒,藥廠和槍手也有意

      懂球帝
      2025-12-19 01:06:16
      一路生花的浪漫誰懂!昆明這條街美到犯規(guī)

      一路生花的浪漫誰懂!昆明這條街美到犯規(guī)

      都市條形碼
      2025-12-16 13:29:59
      他是紅軍軍團(tuán)長,八路軍成立時(shí)卻沒人要,毛主席震怒:這是瞎胡鬧

      他是紅軍軍團(tuán)長,八路軍成立時(shí)卻沒人要,毛主席震怒:這是瞎胡鬧

      比利
      2025-12-18 12:22:56
      當(dāng)年瓜迪奧拉為何拒絕簽下C羅?

      當(dāng)年瓜迪奧拉為何拒絕簽下C羅?

      星耀國際足壇
      2025-12-18 23:30:54
      64歲劉德華被網(wǎng)暴,因《恭喜發(fā)財(cái)》歌詞涉嫌歧視女性,真是破天荒

      64歲劉德華被網(wǎng)暴,因《恭喜發(fā)財(cái)》歌詞涉嫌歧視女性,真是破天荒

      小椰的奶奶
      2025-12-18 14:12:43
      為啥現(xiàn)代人吃紅糖白糖無所謂,古人非要想盡一切辦法,吃白糖呢?

      為啥現(xiàn)代人吃紅糖白糖無所謂,古人非要想盡一切辦法,吃白糖呢?

      向航說
      2025-12-16 00:35:03
      北控遭噩夢(mèng)!沈梓捷90度崴腳,現(xiàn)場(chǎng)大喊“響了”,送醫(yī)照片曝光!

      北控遭噩夢(mèng)!沈梓捷90度崴腳,現(xiàn)場(chǎng)大喊“響了”,送醫(yī)照片曝光!

      細(xì)話籃球
      2025-12-18 23:46:23
      狐貍尾巴藏不住了!業(yè)內(nèi)曝陳曉陳妍希離婚真相,預(yù)兆早就藏不住了

      狐貍尾巴藏不住了!業(yè)內(nèi)曝陳曉陳妍希離婚真相,預(yù)兆早就藏不住了

      李橑在北漂
      2025-12-18 22:24:00
      CT輻射或引發(fā)超10萬例新發(fā)癌癥?做一次CT,對(duì)人體的傷害有多大?

      CT輻射或引發(fā)超10萬例新發(fā)癌癥?做一次CT,對(duì)人體的傷害有多大?

      39健康網(wǎng)
      2025-12-01 18:30:51
      湖南長沙一名媛太漂亮了,仙姿玉色,貌美如花,絕世佳人不過如此

      湖南長沙一名媛太漂亮了,仙姿玉色,貌美如花,絕世佳人不過如此

      冬天來旅游
      2025-12-17 10:24:37
      和丈夫離婚后,她開始和上海首富同居,如今重操舊業(yè)卻已無人問津

      和丈夫離婚后,她開始和上海首富同居,如今重操舊業(yè)卻已無人問津

      夢(mèng)史
      2025-12-18 09:37:30
      我國有上千萬人做心臟彩超!醫(yī)生直言:做一次彩超,或管五年無礙

      我國有上千萬人做心臟彩超!醫(yī)生直言:做一次彩超,或管五年無礙

      岐黃傳人孫大夫
      2025-12-17 15:20:03
      300億收購夢(mèng)碎!聞泰科技手中的安世只剩“空殼”

      300億收購夢(mèng)碎!聞泰科技手中的安世只剩“空殼”

      風(fēng)風(fēng)順
      2025-10-14 10:09:49
      哈佛大學(xué)研究:活過90歲的人29項(xiàng)共同特征

      哈佛大學(xué)研究:活過90歲的人29項(xiàng)共同特征

      尚曦讀史
      2025-12-06 08:27:08
      2025-12-19 04:59:00
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專業(yè)的人工智能媒體
      11950文章數(shù) 142513關(guān)注度
      往期回顧 全部

      科技要聞

      2025新一代人工智能創(chuàng)業(yè)大賽總決賽收官

      頭條要聞

      在野黨參議員問了句日本"存亡危機(jī)" 高市早苗瞬間冷臉

      頭條要聞

      在野黨參議員問了句日本"存亡危機(jī)" 高市早苗瞬間冷臉

      體育要聞

      紐約尼克斯,板正的球隊(duì)

      娛樂要聞

      絲芭放大招了!實(shí)名舉報(bào)鞠婧祎經(jīng)濟(jì)犯罪

      財(cái)經(jīng)要聞

      尹艷林:呼吁加快2.5億新市民落戶進(jìn)程

      汽車要聞

      在零下30℃的考場(chǎng)里 凡爾賽C5 X和508L拿到了"穩(wěn)"的證明

      態(tài)度原創(chuàng)

      親子
      教育
      時(shí)尚
      數(shù)碼
      旅游

      親子要聞

      這些兒童常用藥,有娃的家庭趕緊備起來

      教育要聞

      從「雙減」到禁購試卷:命題權(quán)為何必須回到校內(nèi)?

      陳妍希這婚,離晚了

      數(shù)碼要聞

      LG新一代車用屏下攝像頭將亮相CES 2026,畫質(zhì)達(dá)非屏下產(chǎn)品99%

      旅游要聞

      北緯 36° 奇跡!北方最北茶園憑 1 片葉子,讓貧瘠嶺變富民園

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 久久久久国产a免费观看rela| 亚洲无码电影在线观看| 国产97视频| 国产精品国产主播在线观看| 国产成人a在线观看视频免费| 色婷婷Av| 精品尤物TV福利院在线网站 | www射我里面在线观看| 欧美日韩国产码高清| 中文字幕变态另类| a4yy私人毛片| 亚洲国产精品一区第二页| 青草青草视频2免费观看| 欧美Aⅴ| 亚洲午夜伦费影视在线观看| 无码人妻熟妇av又粗又大| 亚洲成人精品| 九九国产在线观看| 午夜毛片不卡免费观看视频| 亚洲一区二区三区av天堂| 亚洲色欲久久久综合网东京热| 偶偶福利影院| 亚洲av片在线免费观看| 国产精品久久久久影院嫩草| 91小电影| 男人天堂亚洲天堂女人天堂| av色欲无码人妻中文字幕| 亚洲色另类| 性xxxxbbbb| 久久精品中文字幕少妇| 四虎国产精品成人| 2020久久香蕉国产线看观看| 欧美性极品| 性中国熟妇| 国产 另类 在线 欧美日韩| 精品一区二区三人妻视频| 人妻成人网| 大色欧美| 精品不卡| 亚洲欧洲无码AV| 光棍天堂在线手机播放免费|