<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      除夕迎「源神」?Qwen3.5以小勝大,大模型競(jìng)賽下半場(chǎng)開(kāi)始了

      0
      分享至



      編輯|+0、張倩

      農(nóng)歷蛇年的最后一天,當(dāng)所有人都覺(jué)得「今年就卷到這里」的時(shí)候,Qwen3.5-Plus來(lái)了!



      它的特點(diǎn)一句話就可以概括:又強(qiáng)又便宜。

      「強(qiáng)」體現(xiàn)在,模型發(fā)布即登頂。大家現(xiàn)在最關(guān)注的幾項(xiàng)核心能力 —— 多模態(tài)理解、復(fù)雜推理、編程、Agent 智能體,Qwen3.5-Plus 在同級(jí)開(kāi)源模型里都沒(méi)有對(duì)手,又一次強(qiáng)化了社區(qū)里「最強(qiáng)開(kāi)源 = 千問(wèn)」的思想烙印。在多項(xiàng)基準(zhǔn)上,它甚至能媲美或超越 GPT-5.2、Gemini-3-pro 等幾個(gè)第一梯隊(duì)的閉源模型。



      那它有多「便宜」呢?每百萬(wàn) Token 只要 0.8 元,還沒(méi)今天你手里拿的一小把瓜子貴。而它對(duì)標(biāo)的 Gemini-3-pro,價(jià)格足足是它的 18 倍。

      這一定價(jià)不是刻意壓縮成本的結(jié)果,而是由技術(shù)決定的。在一系列架構(gòu)創(chuàng)新的加持下,Qwen3.5-Plus 的參數(shù)被極致精簡(jiǎn),但性能卻更強(qiáng)悍 —— 只用 3970 億的參數(shù)(激活參數(shù)只有 170 億)就超過(guò)了萬(wàn)億參數(shù)的 Qwen3-Max。參數(shù)少了,跑起來(lái)自然輕盈,部署成本直降 60%,推理吞吐量最大提升 19 倍,效率大大提升。

      這是第一次,「最強(qiáng)」和「最便宜」出現(xiàn)在了同一個(gè)模型上。

      在開(kāi)發(fā)者們頭疼都快用不起頂級(jí) AI 的今天,Qwen3.5-Plus 這一「源神」的發(fā)布似乎讓大家打消了顧慮:技術(shù)紅利不再只屬于金字塔尖,而是開(kāi)始真正向下滲透,成為人們手中用起來(lái)沒(méi)有成本焦慮的趁手工具。



      Qwen3.5 可以協(xié)助進(jìn)行網(wǎng)頁(yè)開(kāi)發(fā),尤其在構(gòu)建網(wǎng)頁(yè)和設(shè)計(jì)用戶界面等前端任務(wù)方面表現(xiàn)出色。



      通過(guò)將 OpenClaw 作為第三方智能體環(huán)境集成,Qwen3.5 能夠進(jìn)行網(wǎng)頁(yè)搜索、信息收集和結(jié)構(gòu)化報(bào)告生成。



      借助對(duì)圖像像素級(jí)位置信息的建模,Qwen3.5 在物體計(jì)數(shù)、相對(duì)位置判斷、空間關(guān)系描述等任務(wù)中表現(xiàn)更準(zhǔn)確。

      體驗(yàn)地址:https://chat.qwen.ai/

      當(dāng)然,性能、價(jià)格只是結(jié)果,真正值得展開(kāi)講講的,是支撐這一切的那套底層技術(shù)邏輯。讓我們一起看看,Qwen 這次是怎么又一次捅破天花板的。

      告別「力大磚飛」

      Qwen3.5-Plus 的「以小博大」架構(gòu)革命

      在過(guò)去兩年的大模型軍備競(jìng)賽中,行業(yè)普遍信奉「大力出奇跡」,參數(shù)量從千億一路狂飆至萬(wàn)億級(jí)別。這種「力大磚飛」的模式雖然推高了性能上限,但也讓算力成本和部署門(mén)檻水漲船高。

      Qwen3.5-Plus 則展示了一種更為靈巧的解法:不拼絕對(duì)體量,拼「聰明程度」與底層架構(gòu)的極致效率。

      具體而言,Qwen3.5-Plus 以 397B 的總參數(shù)量,實(shí)現(xiàn)了對(duì)自家萬(wàn)億參數(shù)模型 Qwen3-Max 的性能超越,且多項(xiàng)基準(zhǔn)測(cè)試媲美 Gemini-3-pro 和 GPT-5.2 等閉源第一梯隊(duì)模型。

      這種「以小勝大」的跨級(jí)表現(xiàn),主要?dú)w功于以下四項(xiàng)核心架構(gòu)創(chuàng)新:

      • 混合注意力機(jī)制: 傳統(tǒng)大模型在處理長(zhǎng)文本時(shí),每個(gè) Token 都需要進(jìn)行全量的上下文注意力計(jì)算,這導(dǎo)致算力消耗隨文本長(zhǎng)度呈指數(shù)級(jí)增長(zhǎng)。Qwen3.5-Plus 引入的混合機(jī)制賦予了模型「有詳有略」的閱讀能力,能夠根據(jù)信息權(quán)重動(dòng)態(tài)分配注意力資源,實(shí)現(xiàn)了精度與效率的雙重提升。
      • 極致稀疏的 MoE 架構(gòu):不同于每次推理都需要激活全量參數(shù)的稠密模型,Qwen3.5-Plus 將 MoE(混合專(zhuān)家)架構(gòu)推向了極致。在其 397B 的總參數(shù)中,每次推理僅需激活 17B 的參數(shù)量。這意味著模型只需動(dòng)用不到 5% 的算力,就能調(diào)用全局的知識(shí)儲(chǔ)備。
      • 原生多 Token 預(yù)測(cè):模型打破了傳統(tǒng)大模型「逐字吐出」的生成邏輯,在訓(xùn)練階段就掌握了對(duì)后續(xù)多個(gè)位置進(jìn)行聯(lián)合預(yù)測(cè)的能力。這種「一次想好幾步再說(shuō)」的機(jī)制,使其在代碼補(bǔ)全、長(zhǎng)文本生成等高頻場(chǎng)景中,推理速度接近翻倍,為用戶帶來(lái)幾乎「秒回」的交互體驗(yàn)。
      • 系統(tǒng)級(jí)訓(xùn)練穩(wěn)定性優(yōu)化: 為了讓上述復(fù)雜架構(gòu)在大規(guī)模訓(xùn)練中不翻車(chē),阿里引入了多項(xiàng)深層優(yōu)化,包括歸一化策略與專(zhuān)家路由初始化等。其中最值得一提的是榮獲 NeurIPS 2025 最佳論文獎(jiǎng)的「注意力門(mén)控機(jī)制」。它在注意力層的輸出端精準(zhǔn)調(diào)控信息流,既過(guò)濾了無(wú)效噪音,又防止了關(guān)鍵信息的流失,大幅增強(qiáng)了長(zhǎng)上下文的泛化能力。

      在這套組合拳的加持下,Qwen3.5-Plus 不僅訓(xùn)練成本大降,算力部署成本較 Qwen3-Max 也降低了 60%,推理吞吐量在 256K 長(zhǎng)文本下提升 19 倍,這為大規(guī)模提供推理服務(wù)奠定了基礎(chǔ),也直接促成了其極致的定價(jià)策略。



      拒絕「外掛拼裝」

      Qwen3.5-Plus 的原生多模態(tài)「地基」

      除了在推理效率上「減負(fù)」,Qwen3.5-Plus 的另一大技術(shù)看點(diǎn)在于其跨模態(tài)理解力的重構(gòu)。

      目前業(yè)內(nèi)許多主打「多模態(tài)」的模型,本質(zhì)上仍是工程上的「拼裝」:先訓(xùn)練一個(gè)優(yōu)秀的語(yǔ)言基座,再外掛視覺(jué)或音頻模塊,中間通過(guò)適配層進(jìn)行勉強(qiáng)對(duì)齊。這種做法不僅難以實(shí)現(xiàn)真正的特征融合,有時(shí)還會(huì)出現(xiàn)「視覺(jué)能力增強(qiáng),語(yǔ)言能力降智」的尷尬局面。

      Qwen3.5-Plus 選擇了從地基開(kāi)始重構(gòu),真正實(shí)現(xiàn)了「原生多模態(tài)」。

      從預(yù)訓(xùn)練的第一天起,Qwen3.5-Plus 就在文本與視覺(jué)混合數(shù)據(jù)上進(jìn)行聯(lián)合學(xué)習(xí)。模型在統(tǒng)一的參數(shù)空間內(nèi)深度融合視覺(jué)與語(yǔ)言特征,沒(méi)有中間翻譯帶來(lái)的信息損耗,從而具備了「見(jiàn)圖知意、讀文生境」的直覺(jué)理解力。

      為了讓這種原生融合跑出效率,阿里摒棄了讓視覺(jué)和語(yǔ)言共享同一套并行策略的傳統(tǒng)做法,而是讓不同模態(tài)「各走各的最優(yōu)路徑」,僅在關(guān)鍵節(jié)點(diǎn)進(jìn)行高效匯合。配合精巧的 FP8/FP32 精度應(yīng)用策略,該架構(gòu)成功將激活內(nèi)存減少約 50%,訓(xùn)練提速 10%。更硬核的是,哪怕同時(shí)喂入文本、圖像、視頻三種數(shù)據(jù),它的訓(xùn)練速度也幾乎不受影響,依然能保持和只訓(xùn)練純文本時(shí)相當(dāng)?shù)男省?/p>

      研發(fā)團(tuán)隊(duì)針對(duì)純文本、多模態(tài)和多輪對(duì)話場(chǎng)景搭建了專(zhuān)門(mén)的強(qiáng)化學(xué)習(xí)框架,將整體訓(xùn)練效率提升了 3 至 5 倍,確保模型能夠在海量真實(shí)場(chǎng)景中持續(xù)進(jìn)化。

      這種底層架構(gòu)的躍遷,賦予了 Qwen3.5-Plus 超越「簡(jiǎn)單讀圖」的廣闊能力邊界。目前的 Qwen3.5-Plus 不僅能進(jìn)行圖像的像素級(jí)空間定位,還能理解長(zhǎng)達(dá) 2 小時(shí)視頻的因果時(shí)序,甚至能將手繪草圖直譯為前端代碼,或者化身視覺(jué)智能體自主操控手機(jī)與電腦、跨應(yīng)用完成多步復(fù)雜任務(wù)

      結(jié)合此前在 AI Arena 榜單上位居全球前三、被譽(yù)為「國(guó)產(chǎn) Nano Banana Pro」的 Qwen-image-2.0,阿里在多模態(tài)理解與生成兩條路線上正加速向全面掌握看、聽(tīng)、說(shuō)、做能力的 AGI 目標(biāo)邁進(jìn)。

      算不過(guò)賬的時(shí)代結(jié)束了

      新的競(jìng)賽開(kāi)始了

      過(guò)去兩年,如果你一直在關(guān)注大模型的發(fā)展,其實(shí)會(huì)發(fā)現(xiàn)一件挺有意思的事:閉源模型是你方唱罷我登場(chǎng),前三輪流做,明天榜首指不定是誰(shuí)家。但開(kāi)源領(lǐng)域就很明朗了,很多關(guān)鍵能力的「天花板刷新」,幾乎都發(fā)生在 Qwen 發(fā)新模型的時(shí)候,每一代、每一個(gè)尺寸都能穩(wěn)定輸出。這種創(chuàng)新的連續(xù)性,意味著它已經(jīng)形成了一條可以穩(wěn)定產(chǎn)出的技術(shù)路線,比單次跑分高更說(shuō)明問(wèn)題。

      而這次,Qwen3.5-Plus 又在捅一個(gè)新的天花板 —— 頂級(jí)智能的「性價(jià)比」。當(dāng)模型性能逐漸逼近閉源第一梯隊(duì),同時(shí)價(jià)格卻大幅往下走,事情的性質(zhì)就開(kāi)始變了。以前很多企業(yè)不是不想用最好的 AI,而是算不過(guò)賬?,F(xiàn)在成本結(jié)構(gòu)一變,決策邏輯自然就松動(dòng)了。技術(shù)擴(kuò)散往往卡的不是能力,而是門(mén)檻。

      歷史上類(lèi)似的轉(zhuǎn)折其實(shí)出現(xiàn)過(guò)很多次。真正改變行業(yè)的,往往不是最貴、最極致的系統(tǒng),而是那個(gè)最后變成基礎(chǔ)設(shè)施的東西。Linux 當(dāng)年是這樣,Android 也是這樣:開(kāi)源降低門(mén)檻,生態(tài)把它鋪開(kāi),等你意識(shí)到的時(shí)候,它已經(jīng)無(wú)處不在了。

      而 Qwen3.5-Plus 之所以能捅破這個(gè)天花板,背后不只是一個(gè)模型,而是一整套從模型到算力再到云的聯(lián)動(dòng)。阿里一邊把模型能力通過(guò)開(kāi)源釋放出來(lái),一邊又用阿里云和自研芯片把部署和推理成本繼續(xù)往下壓,本質(zhì)是在同時(shí)解決「用得好嗎」和「用得起嗎」兩個(gè)問(wèn)題。生態(tài)里的采用者也越來(lái)越多,從李飛飛團(tuán)隊(duì)到 Airbnb 這樣的公司,都在把它當(dāng)作實(shí)際可用的底座,而不只是研究對(duì)象。

      所以如果把 Qwen3.5-Plus 只看成又一次模型升級(jí),其實(shí)有點(diǎn)低估它了。更值得關(guān)注的是,一種新的競(jìng)爭(zhēng)方式正在成形:不再只是比誰(shuí)的模型最強(qiáng),而是比誰(shuí)能把足夠強(qiáng)的能力,變成最多人日常用得到的基礎(chǔ)設(shè)施。技術(shù)真正的大規(guī)模落地,往往就是從這種時(shí)刻開(kāi)始的。

      文中視頻鏈接:https://mp.weixin.qq.com/s/MZ_BPDKLsF8uT0XyOhCbrw

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      耗資12億建世界最高佛,如今水喝不起拜不起

      耗資12億建世界最高佛,如今水喝不起拜不起

      時(shí)光流轉(zhuǎn)追夢(mèng)人
      2026-02-20 13:09:13
      尼克松訪華,毛主席只送了4兩茶葉被嫌棄?周總理笑著說(shuō)出4個(gè)字,美國(guó)總統(tǒng)立馬變了臉色

      尼克松訪華,毛主席只送了4兩茶葉被嫌棄?周總理笑著說(shuō)出4個(gè)字,美國(guó)總統(tǒng)立馬變了臉色

      文史明鑒
      2025-12-13 22:15:21
      煙酒不離身卻拿下59塊金牌,23歲選擇退役,今63歲仍為國(guó)家做貢獻(xiàn)

      煙酒不離身卻拿下59塊金牌,23歲選擇退役,今63歲仍為國(guó)家做貢獻(xiàn)

      寒士之言本尊
      2025-12-24 12:26:45
      古巴高調(diào)反美!美國(guó)為啥不打古巴?因?yàn)楣虐褪亲睢跋冗M(jìn)”的國(guó)家

      古巴高調(diào)反美!美國(guó)為啥不打古巴?因?yàn)楣虐褪亲睢跋冗M(jìn)”的國(guó)家

      南宮一二
      2026-01-10 17:41:19
      又奪1金后,中國(guó)隊(duì)排名為何沒(méi)上升?原因曝光,組委會(huì)給出答案

      又奪1金后,中國(guó)隊(duì)排名為何沒(méi)上升?原因曝光,組委會(huì)給出答案

      何老師呀
      2026-02-21 06:24:32
      毛主席批評(píng)彭雪楓搞山頭主義,彭雪楓怒拍桌子:有山頭,但沒(méi)主義

      毛主席批評(píng)彭雪楓搞山頭主義,彭雪楓怒拍桌子:有山頭,但沒(méi)主義

      鶴羽說(shuō)個(gè)事
      2026-01-15 14:50:02
      中方重申:日本根本沒(méi)資格

      中方重申:日本根本沒(méi)資格

      澎湃新聞
      2026-02-21 12:01:04
      測(cè)量319位中國(guó)女性外陰,他們發(fā)表全球首例研究

      測(cè)量319位中國(guó)女性外陰,他們發(fā)表全球首例研究

      醫(yī)學(xué)界
      2026-02-18 17:56:22
      楊瀚森談回應(yīng)球迷期待:聽(tīng)到球迷的呼喊想打得更好,結(jié)果拉了

      楊瀚森談回應(yīng)球迷期待:聽(tīng)到球迷的呼喊想打得更好,結(jié)果拉了

      懂球帝
      2026-02-21 15:38:34
      大年初五返程!廣東年輕人直言:這個(gè)年,過(guò)比上班還累!

      大年初五返程!廣東年輕人直言:這個(gè)年,過(guò)比上班還累!

      生活魔術(shù)專(zhuān)家
      2026-02-21 05:10:19
      真要退役?全紅嬋過(guò)年喝奶茶不怕變胖 又被游客圍堵 下車(chē)轉(zhuǎn)身就跑

      真要退役?全紅嬋過(guò)年喝奶茶不怕變胖 又被游客圍堵 下車(chē)轉(zhuǎn)身就跑

      念洲
      2026-02-21 13:45:42
      豆包推薦:人生回報(bào)率最高的8件事,盡早“焊死”在孩子身上

      豆包推薦:人生回報(bào)率最高的8件事,盡早“焊死”在孩子身上

      十點(diǎn)讀書(shū)
      2026-02-20 18:37:13
      48小時(shí)大變臉!美國(guó)緊急撤回名單,高市急用簡(jiǎn)體中文向中國(guó)低頭

      48小時(shí)大變臉!美國(guó)緊急撤回名單,高市急用簡(jiǎn)體中文向中國(guó)低頭

      鐵錘簡(jiǎn)科
      2026-02-21 00:01:59
      銀行員工說(shuō)出實(shí)情:春節(jié)過(guò)后,建議大家準(zhǔn)備5萬(wàn)現(xiàn)金放在家里!

      銀行員工說(shuō)出實(shí)情:春節(jié)過(guò)后,建議大家準(zhǔn)備5萬(wàn)現(xiàn)金放在家里!

      愛(ài)看劇的阿峰
      2026-02-21 00:56:06
      央視直播!張本智和恐一輪游 王楚欽林詩(shī)棟提前相遇 大滿貫賽賽程+直播

      央視直播!張本智和恐一輪游 王楚欽林詩(shī)棟提前相遇 大滿貫賽賽程+直播

      好乒乓
      2026-02-21 11:27:56
      湖人險(xiǎn)勝快船!三巨頭轟80+15+24卻險(xiǎn)翻車(chē),雷迪克才是最大的短板

      湖人險(xiǎn)勝快船!三巨頭轟80+15+24卻險(xiǎn)翻車(chē),雷迪克才是最大的短板

      小路看球
      2026-02-21 15:15:24
      翻車(chē)!春晚“真彈幕”騙局?罵春晚發(fā)不出,夸的秒顯,網(wǎng)友當(dāng)傻子

      翻車(chē)!春晚“真彈幕”騙局?罵春晚發(fā)不出,夸的秒顯,網(wǎng)友當(dāng)傻子

      戧詞奪理
      2026-02-18 17:43:36
      父親葬禮收了近4萬(wàn)份子錢(qián)!山東網(wǎng)友哭訴,沒(méi)有一個(gè)是因自己來(lái)的

      父親葬禮收了近4萬(wàn)份子錢(qián)!山東網(wǎng)友哭訴,沒(méi)有一個(gè)是因自己來(lái)的

      火山詩(shī)話
      2026-02-21 11:45:52
      震驚,北京知名建筑裝飾公司暴雷了!

      震驚,北京知名建筑裝飾公司暴雷了!

      黯泉
      2026-02-20 21:21:41
      湖人險(xiǎn)勝快船!里弗斯+東契奇轟67分,詹姆斯劃水,艾頓太軟了!

      湖人險(xiǎn)勝快船!里弗斯+東契奇轟67分,詹姆斯劃水,艾頓太軟了!

      籃球資訊達(dá)人
      2026-02-21 13:48:57
      2026-02-21 15:55:00
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專(zhuān)業(yè)的人工智能媒體
      12325文章數(shù) 142569關(guān)注度
      往期回顧 全部

      科技要聞

      智譜上市1月漲5倍,市值超越京東、快手

      頭條要聞

      在貝加爾湖遇難的3名中國(guó)游客身份已確認(rèn):系一家人

      頭條要聞

      在貝加爾湖遇難的3名中國(guó)游客身份已確認(rèn):系一家人

      體育要聞

      冬奧第一"海王"?一人和13國(guó)選手都有關(guān)系

      娛樂(lè)要聞

      鏢人反超驚蟄無(wú)聲拿下單日票房第二!

      財(cái)經(jīng)要聞

      一覺(jué)醒來(lái),世界大變,特朗普改新打法了

      汽車(chē)要聞

      比亞迪的“顏值擔(dān)當(dāng)”來(lái)了 方程豹首款轎車(chē)路跑信息曝光

      態(tài)度原創(chuàng)

      時(shí)尚
      房產(chǎn)
      家居
      手機(jī)
      公開(kāi)課

      2026紐約秋冬時(shí)裝周,在春天開(kāi)啟美的新故事!

      房產(chǎn)要聞

      窗前即地標(biāo)!獨(dú)占三亞灣C位 自貿(mào)港總裁行宮亮相

      家居要聞

      本真棲居 愛(ài)暖伴流年

      手機(jī)要聞

      vivo產(chǎn)品線結(jié)構(gòu)分析,走量最大的是這個(gè)檔次

      公開(kāi)課

      李玫瑾:為什么性格比能力更重要?

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版