<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Claude-Opus-4.6 蒸餾 Qwen3.5 V2 來了

      0
      分享至

      大家好,我是Ai學習的老章

      Claude-Opus-4.6 蒸餾 Qwen3.5 我一直很關注:


      現在 v2 來了,這次的升級重點不是"更準",而是"更快更省"——同樣的準確率,思維鏈縮短了 24%,每個 Token 產出的正確答案多了 31.6%。


      部署條件沒變,Qwen3.5-27B 4bit 單張 4090 即可本地跑起


      v2 到底改了啥?

      先看核心數據:

      指標

      v1

      v2

      變化

      HumanEval pass@1

      96.95%

      96.91%

      基本持平

      思維鏈長度

      基準

      縮短 ~24%

      顯著減少

      每 Token 正確率

      基準

      +31.6%

      大幅提升

      HumanEval+

      基準

      -1.24%

      微降

      MMLU-Pro

      基準

      -7.2%

      有所下降

      簡單說就是:代碼能力幾乎沒掉,但思考效率提升了三成

      這意味著什么?同樣一道編程題,v2 想的更少、答得更快,但正確率一樣。對于跑本地模型的人來說,生成速度本來就是瓶頸,少生成 24% 的 Token 就等于快了 24%——還不用加任何硬件。




      怎么做到的?

      v2 的訓練數據是關鍵。作者 Jackrong 用了14,000 條 Claude 4.6 Opus 風格的通用推理樣本,注意是"通用推理"——數學題、邏輯推理、文字題,不是代碼題。

      這個設計思路很有意思:不針對代碼刷分,而是讓模型學會一種更高效的"思考腳手架"。結果在 HumanEval(代碼測試)上照樣拿了 96.91%,說明底層推理能力的提升是可以跨任務遷移的。

      具體來說,v2 學到的推理模式長這樣:

      Let me analyze this request carefully:


      1. Identify the core objective of the problem.
      2. Break the task into clearly defined subcomponents.
      3. Evaluate constraints and edge cases.
      4. Formulate a step-by-step solution plan.
      5. Execute the reasoning sequentially and verify consistency.

      對比 v1 的長篇大論式思考,v2 更像一個有經驗的工程師——先列大綱再下手,不會在簡單問題上反復糾結。這就是 Claude Opus 的推理風格:結構化、有條理、不廢話。


      訓練細節

      技術棧和 v1 一脈相承:

      • 基座模型:Qwen3.5-27B

      • 訓練框架:Unsloth + LoRA SFT

      • 訓練方式:Response-Only Training,只對 assistant 的思考部分做監督

      • 數據量:~14,000 條篩選后的高質量推理軌跡

      Base Model (Qwen3.5-27B)


      Qwen3.5-27B fine-tuned with Unsloth


      Supervised Fine-Tuning (SFT) + LoRA
      (Response-Only Training masked on "<|im_start|>assistant\n " )


      Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled-v2

      數據來源包括幾個公開的 Claude 4.6 Opus 蒸餾數據集:

      數據集

      用途

      Opus-4.6-Reasoning-3000x-filtered

      Claude 4.6 Opus 推理軌跡

      claude-opus-4.6-10000x

      大規模通用推理遷移

      claude-4.5-opus-high-reasoning-250x

      高強度結構化推理

      Qwen3.5-reasoning-700x

      補充多樣性推理樣本


      代價是什么?

      說完優點,也得說缺點。

      v2 在 **MMLU-Pro 上掉了 7.2%**,也就是通用知識推理能力有所下降。Jackrong也很坦誠地說了,由于 SFT 數據主要是通用推理類,對長上下文理解和復雜多步推理場景可能不如原版 Qwen3.5。

      我的理解是:這是一個典型的"專精 vs 通用"的權衡。如果你主要用來寫代碼、做邏輯推理、解數學題,v2 毫無疑問更好——又快又準。但如果你需要一個什么都能聊的通用模型,原版 Qwen3.5 或者 v1 可能更穩。


      怎么跑?

      跟之前一樣,GGUF 格式直接用 LM Studio、llama.cpp、Ollama 這些工具跑就行。HuggingFace 上提供了多種量化版本:

      模型地址:Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled-v2-GGUF

      之前我用 4090 跑 v1 的 27B 能到 46 Token/s,v2 思維鏈短了 24%,等效推理速度還能再快不少。

      總結

      v2 的核心價值就一句話:用更少的 Token 辦同樣的事。

      • 代碼準確率不掉:HumanEval 96.91%

      • 思維鏈縮短 24%:生成更快,成本更低

      • 每 Token 正確率 +31.6%:推理效率質的飛躍

      • 代價:通用知識推理(MMLU-Pro)下降 7.2%

      對于本地部署場景,這種"推理效率優化"比單純提升準確率更有實際價值——畢竟我們的瓶頸往往不是模型不夠聰明,而是它想得太慢。

      .5

      制作不易,如果這篇文章覺得對你有用,可否點個關注。給我個三連擊:點贊、轉發和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      北京機器人半馬賽場現高顏值機器人Coser,現場觀眾爭相合影

      北京機器人半馬賽場現高顏值機器人Coser,現場觀眾爭相合影

      極目新聞
      2026-04-19 11:28:27
      殺害羅大美的兇手余金生被執行死刑!他瘋狂成魔有兩個原因

      殺害羅大美的兇手余金生被執行死刑!他瘋狂成魔有兩個原因

      細品名人
      2026-04-20 07:40:08
      日本突襲!28萬億市場,中國被踢出局,高市早苗亮出3張底牌

      日本突襲!28萬億市場,中國被踢出局,高市早苗亮出3張底牌

      觸摸史跡
      2026-04-20 13:58:05
      超百萬兵力集結,美伊總決戰在即?中國態度已明確,和美奉陪到底

      超百萬兵力集結,美伊總決戰在即?中國態度已明確,和美奉陪到底

      無情有思ss
      2026-04-17 01:20:47
      CBA季后賽突遭變故!北控因違規派主力被判0比20慘敗

      CBA季后賽突遭變故!北控因違規派主力被判0比20慘敗

      kio魚
      2026-04-19 17:20:17
      陳云晚年首次披露:遵義會議上這兩個人死活不同意毛主席,吵得面紅耳赤

      陳云晚年首次披露:遵義會議上這兩個人死活不同意毛主席,吵得面紅耳赤

      老杉說歷史
      2026-03-21 17:38:44
      WTA500斯圖加特站:萊巴金娜再提保時捷,張帥搶車失敗

      WTA500斯圖加特站:萊巴金娜再提保時捷,張帥搶車失敗

      全網球APP
      2026-04-20 11:10:31
      任澤平退款730萬:價值4500萬的恒大花瓶

      任澤平退款730萬:價值4500萬的恒大花瓶

      超先聲
      2026-04-17 16:34:01
      伊朗萬噸大船闖美軍封鎖線,特朗普暴怒!美官員干脆直接點名中國

      伊朗萬噸大船闖美軍封鎖線,特朗普暴怒!美官員干脆直接點名中國

      林子說事
      2026-04-20 13:19:47
      中東,突發大消息!伊朗革命衛隊向油輪開火!伊朗最高領袖發聲

      中東,突發大消息!伊朗革命衛隊向油輪開火!伊朗最高領袖發聲

      證券時報e公司
      2026-04-18 20:38:43
      莫氏雞煲幫工工資曝光,引全網羨慕,老莫透露后續打算,太通透

      莫氏雞煲幫工工資曝光,引全網羨慕,老莫透露后續打算,太通透

      阿萊美食匯
      2026-04-16 16:00:21
      每體:梅西收購科爾內利亞后,俱樂部已開始銷售其周邊產品

      每體:梅西收購科爾內利亞后,俱樂部已開始銷售其周邊產品

      懂球帝
      2026-04-20 12:59:04
      極端情況下,切爾西可能要靠輸給利物浦來獲得歐冠資格

      極端情況下,切爾西可能要靠輸給利物浦來獲得歐冠資格

      懂球帝
      2026-04-20 00:22:46
      萬科跟投員工千人聯合簽名

      萬科跟投員工千人聯合簽名

      地產微資訊
      2026-04-17 16:03:16
      建議中老年人:若不差錢,少吃饅頭和米飯,多吃4種主食,身體棒

      建議中老年人:若不差錢,少吃饅頭和米飯,多吃4種主食,身體棒

      馬蹄燙嘴說美食
      2026-04-20 03:33:58
      美國“密謀兵變”,以色列80年魔咒成真?正在復燃的美國反猶本色

      美國“密謀兵變”,以色列80年魔咒成真?正在復燃的美國反猶本色

      南宗歷史
      2026-04-19 23:11:51
      讓人揪心的事終究來了?央行定調,5月后房產、存款或將迎來調整

      讓人揪心的事終究來了?央行定調,5月后房產、存款或將迎來調整

      復轉這些年
      2026-04-19 23:17:41
      杜鋒展望山西!直指困難,回應胡明軒徐杰身體狀態與拉科加盟話題

      杜鋒展望山西!直指困難,回應胡明軒徐杰身體狀態與拉科加盟話題

      籃球資訊達人
      2026-04-20 13:25:26
      60多歲大爺相親,只要年輕漂亮的,只要夠漂亮,錢還可以再加!

      60多歲大爺相親,只要年輕漂亮的,只要夠漂亮,錢還可以再加!

      哄動一時啊
      2026-04-19 11:42:21
      戴帽子會引發腦梗?醫生含淚勸告:70歲以后,這3件事一定要盯緊

      戴帽子會引發腦梗?醫生含淚勸告:70歲以后,這3件事一定要盯緊

      荷蘭豆愛健康
      2026-04-19 22:24:42
      2026-04-20 14:39:00
      Ai學習的老章 incentive-icons
      Ai學習的老章
      Ai學習的老章
      3335文章數 11137關注度
      往期回顧 全部

      科技要聞

      藍色起源一級火箭完美回收 客戶衛星未入軌

      頭條要聞

      媒體:伊朗剛說不談 美國立即開打

      頭條要聞

      媒體:伊朗剛說不談 美國立即開打

      體育要聞

      阿森納已拼盡全力,但你早干嘛去了...

      娛樂要聞

      鹿晗生日上熱搜,被關曉彤撕下體面

      財經要聞

      月之暗面IPO迷局

      汽車要聞

      把天門山搬進廠?開仰望U8沖上45度坡的那刻 我腿軟了

      態度原創

      數碼
      藝術
      時尚
      手機
      軍事航空

      數碼要聞

      消息稱谷歌無屏健身手環定名Google Fitbit Air

      藝術要聞

      王羲之《換鵝帖》尚在人間,驚艷無比!

      今年最流行的衣服竟然是它?高級又氣質!

      手機要聞

      小米、vivo、OPPO、榮耀當家旗艦最新銷量比比看

      軍事要聞

      特朗普:美艦向伊朗貨船開火炸出個洞

      無障礙瀏覽 進入關懷版