<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      Qwen3-Next 實(shí)測(cè),有點(diǎn)失望

      0
      分享至

      大家好,我是 Ai 學(xué)習(xí)的老章

      前文:,Qwen3-Next 的思考和指令兩個(gè)模型官方性能測(cè)試結(jié)果十分誘人。僅用 3B 活躍參數(shù)即可達(dá)到 DeepSeek V3.1 級(jí)別的智能水平


      Qwen3 Next 80B(推理版)在 Qwen3 模型家族中智能程度排名第二,介于 Qwen3 235B 2507(推理版)與剛發(fā)布的 Qwen3-Max(預(yù)覽版,不使用推理)之間


      我早就下好了完整模型文件 -160GB+


      但是后來(lái)出了 FP8 量化版,模型文件大小減半,可裝入單張 H200 GPU

      但是我用 0.10.2 版本的 vLLM 無(wú)論怎么改參數(shù)都部署失敗

      無(wú)奈就還跑原版,2xH200 開(kāi)跑

      腳本如下:

      docker run --rm -d --runtime nvidia  --name qwen3-next-tk-server  --ipc=host --gpus '"device=4,5"'  -p 8001:8000  -v /data/ai:/models vllm/vllm-openai:v0.10.2  --model /models/Qwen3-Next-80B-A3B-Thinking  --served-model-name qwen3-next-tk-fp8 --port 8000   --max-num-seqs 50 --max-model-len  131072  --tensor-parallel-size 2
      [! 注意] 默認(rèn)上下文長(zhǎng)度為 256K。如果遇到內(nèi)存不足(OOM)問(wèn)題,可以考慮將上下文長(zhǎng)度減少到更小的值。但是,由于模型可能需要更長(zhǎng)的 token 序列進(jìn)行推理,我們強(qiáng)烈建議盡可能使用大于 131,072 的上下文長(zhǎng)度。

      ps:上下文上限跑起需要使用 4 張 H200/H20 或 4 張 A100/A800 GPU 來(lái)啟動(dòng),這里我減半到官方建議的 131072

      每卡上模型加載 75GB,耗時(shí) 44 秒,KV Cache 49.5GB,峰值激活內(nèi)存 0.62GB,非 Torch 顯存占用 1.38GB,合計(jì) 126GB 的樣子

      運(yùn)行成功后接入 OpenWebUI,簡(jiǎn)單測(cè)試了一下,略失望,原因有幾:

      1 是首 token 響應(yīng)延遲,大幾秒的樣子才開(kāi)始回復(fù)

      2 是 think 標(biāo)簽缺失,導(dǎo)致整個(gè)思考過(guò)程無(wú)法被識(shí)別,直接被打印,而非可隱藏

      原因阿里也有解釋?zhuān)?/p>

      [! 注意] Qwen3-Next-80B-A3B-Thinking 僅支持思考模式。為了強(qiáng)制模型進(jìn)行思考,默認(rèn)聊天模板自動(dòng)包含 \ 。因此,模型的輸出只包含 \<\/think\> 而沒(méi)有顯式的 \ 標(biāo)簽是正常的。

      我看魔塔社區(qū)也有網(wǎng)友在抱怨,不知道為啥 Qwen 要這么搞,與之前模型保持一致不好嗎?無(wú)故增加下游應(yīng)用適配成本


      3 是思考過(guò)程非常、非常、非常長(zhǎng),長(zhǎng)到時(shí)常會(huì)無(wú)限思考

      原因阿里還是有解釋?zhuān)?/p>

      [! 注意] Qwen3-Next-80B-A3B-Thinking 可能會(huì)生成比其前身更長(zhǎng)的思考內(nèi)容。我們強(qiáng)烈建議將其用于高度復(fù)雜的推理任務(wù)。

      4 是并發(fā)太低了

      啟動(dòng)腳本設(shè)置了--max-num-seqs 50,但是我用測(cè)試工具跑了一下,由于前面三個(gè)問(wèn)題,并發(fā)幾乎跑不起來(lái),全是 error


      5Qwen3-Next 也支持多詞元預(yù)測(cè)(簡(jiǎn)稱(chēng) MTP),它既提升了預(yù)訓(xùn)練效率,也加快了推理速度。我試了一下,單請(qǐng)求快了點(diǎn),但是上面四個(gè)問(wèn)題都存在。

      docker run --rm -d --runtime nvidia  --name qwen3-next-tk-server  --ipc=host --gpus '"device=4,5"'  -p 8001:8000  -v /data/ai:/models vllm/vllm-openai:v0.10.2  --model /models/Qwen3-Next-80B-A3B-Thinking  --served-model-name qwen3-next-tk-fp8 --port 8000   --max-num-seqs 50 --max-model-len  131072  --tensor-parallel-size 2 --speculative-config '{"method": "qwen3_next_mtp", "num_speculative_tokens": 2}'  --no-enable-chunked-prefill

      哪位兄弟本地部署過(guò)Qwen3-Next-80B-A3B-Thinking,感受如何?

      如有發(fā)現(xiàn)我的腳本有問(wèn)題,歡迎提出,我還是有點(diǎn)不敢相信它會(huì)這么不堪。

      或許它真就只適合高度復(fù)雜的推理任務(wù)?


      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      15歲女兒遭同班14歲男生殺害,父親講述煎熬:5個(gè)月來(lái)借酒澆愁最多一天喝2斤

      15歲女兒遭同班14歲男生殺害,父親講述煎熬:5個(gè)月來(lái)借酒澆愁最多一天喝2斤

      大風(fēng)新聞
      2025-12-24 20:58:04
      1909年,64的趙爾豐帶著2萬(wàn)清軍,冰天雪地,力保西南百萬(wàn)國(guó)土

      1909年,64的趙爾豐帶著2萬(wàn)清軍,冰天雪地,力保西南百萬(wàn)國(guó)土

      云霄紀(jì)史觀
      2025-12-23 17:59:09
      湖北一大媽跳了20多年廣場(chǎng)舞后,拿100多個(gè)金鐲子去賣(mài),說(shuō)家里還有金項(xiàng)鏈沒(méi)拿,我人好,都是別人送的

      湖北一大媽跳了20多年廣場(chǎng)舞后,拿100多個(gè)金鐲子去賣(mài),說(shuō)家里還有金項(xiàng)鏈沒(méi)拿,我人好,都是別人送的

      LULU生活家
      2025-12-24 18:51:10
      朱元璋的姐夫是聰明人,朱元璋當(dāng)皇帝后問(wèn)他要啥官,他回了8個(gè)字

      朱元璋的姐夫是聰明人,朱元璋當(dāng)皇帝后問(wèn)他要啥官,他回了8個(gè)字

      長(zhǎng)風(fēng)文史
      2025-12-23 21:14:32
      一年白忙?一考生帶機(jī)械表進(jìn)考場(chǎng)被判作弊,堅(jiān)持考完決絕申訴!

      一年白忙?一考生帶機(jī)械表進(jìn)考場(chǎng)被判作弊,堅(jiān)持考完決絕申訴!

      知曉科普
      2025-12-25 09:35:05
      男子在家抽煙被上門(mén)勸阻?這屆“小仙女”越來(lái)越魔怔了

      男子在家抽煙被上門(mén)勸阻?這屆“小仙女”越來(lái)越魔怔了

      姬鵬
      2025-12-24 22:20:01
      迪拜品牌推出“Dabubu”盲盒,10個(gè)盲盒隱藏款有18K金鏈

      迪拜品牌推出“Dabubu”盲盒,10個(gè)盲盒隱藏款有18K金鏈

      半島晨報(bào)
      2025-12-24 19:45:03
      投入超1000億美元,以色列將打造獨(dú)立軍工產(chǎn)業(yè)!哈馬斯最新表態(tài)

      投入超1000億美元,以色列將打造獨(dú)立軍工產(chǎn)業(yè)!哈馬斯最新表態(tài)

      每日經(jīng)濟(jì)新聞
      2025-12-24 23:23:06
      一個(gè)女?huà)胫琅c一個(gè)系統(tǒng)的失靈

      一個(gè)女?huà)胫琅c一個(gè)系統(tǒng)的失靈

      難得君
      2025-12-23 00:16:47
      取錢(qián)新規(guī)執(zhí)行!2025以后,死者的存款,再也不用受銀行的氣啦!

      取錢(qián)新規(guī)執(zhí)行!2025以后,死者的存款,再也不用受銀行的氣啦!

      巢客HOME
      2025-12-25 10:15:03
      特朗普下令,真正的較量開(kāi)始,美國(guó)選好主戰(zhàn)場(chǎng),要與中國(guó)一決高下

      特朗普下令,真正的較量開(kāi)始,美國(guó)選好主戰(zhàn)場(chǎng),要與中國(guó)一決高下

      空天力量
      2025-12-24 17:06:37
      海歸光環(huán)徹底消失?49.5萬(wàn)留學(xué)生涌回國(guó),殘酷真相:企業(yè)只認(rèn)這個(gè)

      海歸光環(huán)徹底消失?49.5萬(wàn)留學(xué)生涌回國(guó),殘酷真相:企業(yè)只認(rèn)這個(gè)

      夢(mèng)史
      2025-12-23 10:18:20
      大量“洋垃圾”小主機(jī)流入閑魚(yú)!能用9代標(biāo)壓U,準(zhǔn)系統(tǒng)275元

      大量“洋垃圾”小主機(jī)流入閑魚(yú)!能用9代標(biāo)壓U,準(zhǔn)系統(tǒng)275元

      閑搞機(jī)
      2025-12-25 11:06:11
      得罪上司被調(diào)崗淪為前臺(tái)后,我爸深夜接我下班,竟讓上司當(dāng)場(chǎng)嚇癱

      得罪上司被調(diào)崗淪為前臺(tái)后,我爸深夜接我下班,竟讓上司當(dāng)場(chǎng)嚇癱

      云端小院
      2025-12-25 09:42:26
      最近,美國(guó)連續(xù)扣押多艘中國(guó)商船,中國(guó)是如何反擊的?

      最近,美國(guó)連續(xù)扣押多艘中國(guó)商船,中國(guó)是如何反擊的?

      阿胡
      2025-12-23 17:56:32
      我國(guó)在阿根廷的天文望遠(yuǎn)鏡被米萊停建,稱(chēng)有軍用潛力!或因美施壓

      我國(guó)在阿根廷的天文望遠(yuǎn)鏡被米萊停建,稱(chēng)有軍用潛力!或因美施壓

      科普大世界
      2025-12-24 20:55:59
      朱芳雨賭對(duì)了!麥考爾確認(rèn)復(fù)出,廣東隊(duì)拒絕簽約第5外援!

      朱芳雨賭對(duì)了!麥考爾確認(rèn)復(fù)出,廣東隊(duì)拒絕簽約第5外援!

      緋雨兒
      2025-12-25 12:07:17
      獨(dú)生子女父母退休金加5%?社保局排起長(zhǎng)隊(duì),真相到底如何?

      獨(dú)生子女父母退休金加5%?社保局排起長(zhǎng)隊(duì),真相到底如何?

      甜檸聊史
      2025-12-25 10:20:48
      誰(shuí)設(shè)計(jì)了斬殺線?

      誰(shuí)設(shè)計(jì)了斬殺線?

      新潮沉思錄
      2025-12-24 21:28:17
      5-1,40歲C羅發(fā)威:無(wú)敵挑傳助攻,率隊(duì)豪取亞冠6連勝+斬獲第一

      5-1,40歲C羅發(fā)威:無(wú)敵挑傳助攻,率隊(duì)豪取亞冠6連勝+斬獲第一

      側(cè)身凌空斬
      2025-12-25 05:32:35
      2025-12-25 14:51:00
      機(jī)器學(xué)習(xí)與Python社區(qū) incentive-icons
      機(jī)器學(xué)習(xí)與Python社區(qū)
      機(jī)器學(xué)習(xí)算法與Python
      3233文章數(shù) 11081關(guān)注度
      往期回顧 全部

      科技要聞

      屠龍少年被"招安"!英偉達(dá)平安夜豪擲200億

      頭條要聞

      朱孝天舉報(bào)阿信所屬公司:勾結(jié)黃牛炒票逃稅、假唱

      頭條要聞

      朱孝天舉報(bào)阿信所屬公司:勾結(jié)黃牛炒票逃稅、假唱

      體育要聞

      單賽季11冠,羽壇“安洗瑩時(shí)代”真的來(lái)了

      娛樂(lè)要聞

      金莎小19歲男友求婚成功!兩人雪地?fù)砦?/h3>

      財(cái)經(jīng)要聞

      美國(guó)未來(lái)18個(gè)月不對(duì)中國(guó)芯片加額外關(guān)稅

      汽車(chē)要聞

      預(yù)售31.3萬(wàn)元起 全新奧迪Q5L將于1月內(nèi)上市

      態(tài)度原創(chuàng)

      游戲
      健康
      房產(chǎn)
      親子
      手機(jī)

      4G游戲塞了3G音樂(lè),這款騰訊游戲如何成了500萬(wàn)人的隨身聽(tīng)?

      這些新療法,讓化療不再那么痛苦

      房產(chǎn)要聞

      硬核!央企海口一線江景頂流紅盤(pán),上演超預(yù)期交付!

      親子要聞

      給兒子打昂貴激素,卻給粉絲猛推鈣片,為了錢(qián),冉瑩穎良心不痛嗎

      手機(jī)要聞

      榮耀Power2新機(jī)跑分出爐,暫定下個(gè)月登場(chǎng)

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 欧美偷拍视频| 国产一卡二卡在线| 亚洲精品熟女| 性色欲情网站| 国产精品爽爽ⅴa在线观看| 91密桃精品国产91久久| 精品久久久久久中文字幕无码百度| 色婷婷久| 狠狠?综合?精品?伊人| 成人无遮挡裸免费视频在线观看| 国产欧美日韩亚洲一区二区三区| 欧美做受???免费| 越西县| 日韩欧美人妻一区二区三区| 性做久久久久久| 国产乱子影视频上线免费观看| www.人与兽| 亚洲做第3页| 乱子轮熟睡1区| 性人久久久久| 蜜桃av在线| 狠狠cao日日穞夜夜穞av| 99久热re在线精品99 6热视频 | 1769国内精品视频在线播放| 91精品久久久无码中文字幕少妇| 金坛市| 亚洲色偷拍区另类无码专区| 亚洲AV无码久久久久网站蜜桃| 色www88| 亚洲精品成人a?v久久| 免费男人下部进女人下部视频| 性姿势真人免费视频放| 国产精女处破视频在线| 亚洲精品美女久久久久久久| 开心五月色婷婷综合开心网| 国产成人精品18| 91色综合| 成人性生交大片免费看r老牛网站 中文字幕一区二区三区四区五区 久久久久久毛片免费播放 | 亚洲AV无码久久精品色欲| 久久99国产精品久久| 国产精品成|