<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      多模態(tài)不是拼模塊,千問新模型證明了最關(guān)鍵的一件事

      0
      分享至

      林俊旸離職了,但 Qwen 不能停。最近 Qwen3.5-Omni 發(fā)布,一個(gè)原生全模態(tài)大模型,文本、圖片、音頻、視頻的理解與生成,集于一身。


      這不是第一個(gè)試圖「什么都做」的模型。過去兩年,多模態(tài)是所有大模型公司都在講的故事。大多數(shù)方案的本質(zhì)是拼接:語音進(jìn)來先轉(zhuǎn)文字,文字處理完再轉(zhuǎn)語音,圖片走一條獨(dú)立通道,視頻又是另一條。模塊之間的信息在翻譯中不斷損耗。

      Qwen3.5-Omni 走了另一條路。它的 Thinker-Talker 架構(gòu)讓所有模態(tài)在同一個(gè)模型內(nèi)原生處理——Thinker 負(fù)責(zé)跨模態(tài)的深度推理,Talker 負(fù)責(zé)實(shí)時(shí)語音輸出,兩者共享同一套表征空間。


      結(jié)果是:在音頻、視頻、推理和交互任務(wù)上拿下 215 項(xiàng)子任務(wù)的 SOTA 成績(jī),音頻理解/推理/識(shí)別/翻譯/對(duì)話全面超越 Gemini-3.1 Pro,同時(shí)視覺和文本能力保持同尺寸 Qwen3.5 的水平,沒有退化。

      比數(shù)字更值得看的,是 Qwen 團(tuán)隊(duì)在發(fā)布頁上放出的那批演示視頻,不是做題,也不是跑分,而是在展示「和 AI 互動(dòng)」這件事可以是什么樣。

      看見你看見的

      Qwen3.5-Omni 處理視頻素材是多管齊下:自動(dòng)切片,標(biāo)注時(shí)間戳,識(shí)別畫面中的人物、動(dòng)作與空間關(guān)系,同時(shí)分析音軌中的背景音效和對(duì)話內(nèi)容。模型真正在做的,對(duì)時(shí)間線上視聽信息的同步解析。像下面的視頻片段來自《舌尖上的中國》,3.5-Omni 能生成的是結(jié)構(gòu)化的細(xì)粒度描述。


      更復(fù)雜的場(chǎng)景里,模型處理的是電影片段:多人、多鏡頭、復(fù)雜音效疊加。它能區(qū)分不同角色的對(duì)話,識(shí)別背景音樂的情緒色彩,描述鏡頭調(diào)度和場(chǎng)景切換。


      這些能力可以用在什么場(chǎng)景下呢?一個(gè)偏向應(yīng)用的演示是內(nèi)容合規(guī)審查:給模型一段游戲視頻,它自動(dòng)按時(shí)間段輸出違規(guī)類型、風(fēng)險(xiǎn)等級(jí)和具體描述,生成完整的合規(guī)預(yù)警摘要表。傳統(tǒng)方案需要人工逐幀審核,這里模型直接給出結(jié)構(gòu)化結(jié)果。


      聽懂你說的

      如果說上面的演示展示的是模型「看」的能力,下面這組則展示了它「進(jìn)入場(chǎng)景」的能力。

      博客上的一個(gè)演示是多輪對(duì)話與智能打斷:用戶舉著手機(jī)和模型共讀一篇論文,隨時(shí)插話提問。模型基于 Omni 架構(gòu)原生支持語義打斷,區(qū)分用戶的有意打斷和無意義的背景音,不會(huì)在你清嗓子的時(shí)候停下來。這依賴于模型對(duì) turn-taking 意圖的實(shí)時(shí)識(shí)別,而不是簡(jiǎn)單的音量閾值檢測(cè)。


      另一個(gè)令人印象深刻的演示是歌詞字幕生成:一首糅合了多種方言的 rap 被送入模型,輸出是帶精確時(shí)間戳的逐句歌詞。并且沒有「翻譯」的調(diào)整,比如在識(shí)別粵語歌詞時(shí),返送的就是粵語行文,沒有自作主張轉(zhuǎn)換成普通話。Qwen3.5-Omni 支持 113 種語言的語音識(shí)別和 36 種方言的語音生成,這個(gè)覆蓋面本身就是一個(gè)值得注意的信號(hào)。

      模型在海量文本、視覺以及超過1億小時(shí)的音視頻數(shù)據(jù)上進(jìn)行原生多模態(tài)預(yù)訓(xùn)練。相比上一代 Qwen3-Omni,多語言能力大幅增強(qiáng):語音識(shí)別從此前的版本躍升至 113 種語言,語音生成覆蓋 36種方言。

      從「看視頻」到「寫代碼」

      最出人意料的一組演示來自 Qwen 團(tuán)隊(duì)稱為「Audio-Visual Vibe Coding」的能力。

      第一個(gè)案例:用戶展示一段音樂游戲的視頻,模型觀察游戲畫面和音效后,直接生成可運(yùn)行的游戲代碼。不是描述游戲邏輯,而是寫出代碼。


      第二個(gè)案例更接近實(shí)際產(chǎn)品開發(fā):用戶展示一個(gè)產(chǎn)品原型的演示視頻,模型將視覺設(shè)計(jì)和交互邏輯轉(zhuǎn)化為前端代碼。


      Qwen 團(tuán)隊(duì)在技術(shù)報(bào)告中指出,這種「看視頻寫代碼」的能力并不在模型的訓(xùn)練目標(biāo)中——它是原生多模態(tài) Scaling 過程中涌現(xiàn)出來的。當(dāng)視覺、聽覺和語言的表征被聯(lián)合訓(xùn)練到足夠深度時(shí),模型自發(fā)地學(xué)會(huì)了在模態(tài)之間建立因果關(guān)系,而不僅僅是相關(guān)性。

      支撐這些能力的,是 Qwen3.5-Omni 的 Hybrid-Attention MoE 架構(gòu),在同一潛空間內(nèi)聯(lián)合訓(xùn)練所有模態(tài)的 token。這意味著模型在「思考」時(shí),文字、圖像、聲音是同一種東西,不存在模態(tài)間的翻譯損耗。

      以往的語音大模型要么思考慢但回答深,要么響應(yīng)快但內(nèi)容淺。但今天 Qwen 發(fā)布的這些演示視頻,比任何 benchmark 數(shù)字都更能說明,全模態(tài) AI 在 2026 年能做到什么。


      我們正在招募伙伴

      簡(jiǎn)歷投遞郵箱 hr@ifanr.com

      ?? 郵件標(biāo)題 「姓名+崗位名稱」(請(qǐng)隨簡(jiǎn)歷附上項(xiàng)目/作品或相關(guān)鏈接)


      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      油價(jià)要跌破天!4月9日油價(jià)迎來大幅暴跌,調(diào)價(jià)后全國地區(qū)油價(jià)價(jià)格

      油價(jià)要跌破天!4月9日油價(jià)迎來大幅暴跌,調(diào)價(jià)后全國地區(qū)油價(jià)價(jià)格

      趣味萌寵的日常
      2026-04-09 15:43:22
      錦雞股份業(yè)績(jī)虧損;美聯(lián)儲(chǔ)或?qū)⒔迪ⅲ恍劳_(dá)股價(jià)大漲;堅(jiān)朗五金首現(xiàn)虧損 | 4月12日財(cái)經(jīng)日?qǐng)?bào)

      錦雞股份業(yè)績(jī)虧損;美聯(lián)儲(chǔ)或?qū)⒔迪ⅲ恍劳_(dá)股價(jià)大漲;堅(jiān)朗五金首現(xiàn)虧損 | 4月12日財(cái)經(jīng)日?qǐng)?bào)

      財(cái)經(jīng)的視界
      2026-04-12 01:02:39
      美伊停火后,俄方態(tài)度180度大變,批評(píng)伊朗:攻擊了我們的兄弟

      美伊停火后,俄方態(tài)度180度大變,批評(píng)伊朗:攻擊了我們的兄弟

      肖茲探秘說
      2026-04-10 18:09:07
      爭(zhēng)議!海港1場(chǎng)4次換人 疑違規(guī)用腦震蕩換人 楊世元傷腿卻倒地捂頭

      爭(zhēng)議!海港1場(chǎng)4次換人 疑違規(guī)用腦震蕩換人 楊世元傷腿卻倒地捂頭

      我愛英超
      2026-04-11 22:17:09
      2-1絕殺升班馬,梅州客家逆轉(zhuǎn)+迎2連勝,32歲廣州隊(duì)舊將一劍封喉

      2-1絕殺升班馬,梅州客家逆轉(zhuǎn)+迎2連勝,32歲廣州隊(duì)舊將一劍封喉

      俯身沖頂
      2026-04-11 21:28:01
      楊振寧去世5個(gè)月后,49歲翁帆現(xiàn)狀:剪了頭發(fā)染了色,仍獨(dú)居國內(nèi)

      楊振寧去世5個(gè)月后,49歲翁帆現(xiàn)狀:剪了頭發(fā)染了色,仍獨(dú)居國內(nèi)

      照見古今
      2026-03-26 19:06:28
      重磅!萬科有救了?深圳出手了!

      重磅!萬科有救了?深圳出手了!

      阿離家居
      2026-04-11 08:30:11
      蔣緯國臨終前爆料:蔣介石根本沒有生育能力,蔣經(jīng)國也不是親生的

      蔣緯國臨終前爆料:蔣介石根本沒有生育能力,蔣經(jīng)國也不是親生的

      芳芳?xì)v史燴
      2026-04-11 18:48:07
      益陽家長(zhǎng)請(qǐng)收好!2026年中小學(xué)招生入學(xué)政策要點(diǎn)匯總

      益陽家長(zhǎng)請(qǐng)收好!2026年中小學(xué)招生入學(xué)政策要點(diǎn)匯總

      益陽廣電
      2026-04-11 14:16:12
      李想朋友圈炮轟:遭遇“最惡劣內(nèi)卷”,東風(fēng)日產(chǎn)高管回應(yīng):尊重每一家同行,包括理想汽車

      李想朋友圈炮轟:遭遇“最惡劣內(nèi)卷”,東風(fēng)日產(chǎn)高管回應(yīng):尊重每一家同行,包括理想汽車

      魯中晨報(bào)
      2026-04-11 19:48:04
      65年的奇跡!林肯城重返英冠,“小魔鬼”終于等到了這一天

      65年的奇跡!林肯城重返英冠,“小魔鬼”終于等到了這一天

      陌識(shí)
      2026-04-10 22:21:09
      升級(jí)版的仙人跳,比戴綠帽子還憋屈

      升級(jí)版的仙人跳,比戴綠帽子還憋屈

      霹靂炮
      2026-02-24 22:53:34
      大快人心!國家出手擒下3名華人首富,他們干的事,根本不能饒恕

      大快人心!國家出手擒下3名華人首富,他們干的事,根本不能饒恕

      墨印齋
      2026-03-24 21:34:56
      跑高速時(shí),車速120其實(shí)最費(fèi)油,內(nèi)行人:保持這個(gè)速度才最省油

      跑高速時(shí),車速120其實(shí)最費(fèi)油,內(nèi)行人:保持這個(gè)速度才最省油

      西莫的藝術(shù)宮殿
      2026-04-11 18:58:45
      女兒涉嫌抄襲,賈平凹應(yīng)有所回應(yīng)

      女兒涉嫌抄襲,賈平凹應(yīng)有所回應(yīng)

      觀察者網(wǎng)
      2026-04-09 11:31:07
      盼了好久!《佳偶天成》新劇照釋出,四月終于要開播啦

      盼了好久!《佳偶天成》新劇照釋出,四月終于要開播啦

      小邵說劇
      2026-04-10 17:33:17
      洛克希德馬丁公司宣傳“超級(jí)大力神”為美軍在伊朗損失C-130洗地

      洛克希德馬丁公司宣傳“超級(jí)大力神”為美軍在伊朗損失C-130洗地

      hawk26講武堂
      2026-04-10 13:09:52
      7歲女童陰道炎反復(fù)難愈,手術(shù)后竟然取出一整支精華液!

      7歲女童陰道炎反復(fù)難愈,手術(shù)后竟然取出一整支精華液!

      深圳晚報(bào)
      2026-04-09 16:19:33
      爭(zhēng)冠懸念再起,阿森納多賽兩輪暫時(shí)領(lǐng)先曼城9分

      爭(zhēng)冠懸念再起,阿森納多賽兩輪暫時(shí)領(lǐng)先曼城9分

      懂球帝
      2026-04-11 22:16:10
      莫拉托格魯:球迷老齡化越來越嚴(yán)重,年輕人不再看比賽而只看集錦

      莫拉托格魯:球迷老齡化越來越嚴(yán)重,年輕人不再看比賽而只看集錦

      網(wǎng)球之家
      2026-04-11 22:34:21
      2026-04-12 02:56:49
      AppSo incentive-icons
      AppSo
      讓智能手機(jī)更好用的秘密
      6292文章數(shù) 26819關(guān)注度
      往期回顧 全部

      科技要聞

      半夜被燃燒瓶砸醒,OpenAI CEO發(fā)文反思

      頭條要聞

      事關(guān)霍爾木茲海峽通行安排 伊美各執(zhí)一詞

      頭條要聞

      事關(guān)霍爾木茲海峽通行安排 伊美各執(zhí)一詞

      體育要聞

      換帥之后,他們從降級(jí)區(qū)沖到升級(jí)區(qū)

      娛樂要聞

      鄭鈞回應(yīng)兒子走路:會(huì)監(jiān)督他挺直腰板

      財(cái)經(jīng)要聞

      從日本翻身看:這次誰能扛住高油價(jià)?

      汽車要聞

      煥新極氪007/007GT上市 限時(shí)19.39萬起

      態(tài)度原創(chuàng)

      教育
      親子
      房產(chǎn)
      藝術(shù)
      軍事航空

      教育要聞

      阿圖什西部計(jì)劃志愿者訪顧炎武家鄉(xiāng)

      親子要聞

      孩子出現(xiàn)這些行為,不是早戀那么簡(jiǎn)單!

      房產(chǎn)要聞

      土地供應(yīng)突然暴跌!2026海口樓市,格局大變!

      藝術(shù)要聞

      你絕對(duì)想不到,這個(gè)國家美女竟如此多!

      軍事要聞

      伊朗議長(zhǎng)帶四名遇難兒童照片赴美伊談判

      無障礙瀏覽 進(jìn)入關(guān)懷版