<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      新技術:無需編解碼器,NEO-unify如何打造原生視覺語言理解與生成

      0
      分享至

      當前多模態智能架構困境

      長期以來,多模態研究已形成一種默認范式:視覺編碼器(Vision Encoder, VE) 負責感知與理解,而變分自編碼器(Variational Autoencoder, VAE) 則用于內容生成。近期的一些工作嘗試構建共享編碼器,但這種折衷往往引入新的結構性設計權衡。

      由此回到第一性原理:構建一體化模型直接處理原生輸入,即像素本身與文字本身。商湯科技聯合南洋理工大學,提出一種全新的架構范式:NEO-unify(preview),一個原生、統一、端到端的多模態模型架構。它不僅越過了當前視覺表征的爭論,也擺脫了預訓練先驗和規模定律瓶頸的限制。最關鍵的是:不需要 VE,也不需要 VAE

      我們正擴大規模、持續迭代。更多模型與開源成果,將很快與大家見面。

      NEO-unify原生一體化架構新范式


      NEO-unify 第一次邁向真正的端到端統一框架,能夠直接從近乎無損的信息輸入中學習,并由模型自身塑造內部表征空間。首先,引入近似無損的視覺接口,用于統一圖像的輸入與輸出表示;其次,采用原生混合Transformer(Mixture-of-Transformer,MoT)架構,使理解與生成能夠在同一體系中協同進行;最終,通過統一學習框架實現跨模態訓練:文本采用自回歸交叉熵目標,視覺通過像素流匹配進行優化。

      模型效果

      1. 定量結果分析



      2. 生圖效果展示



      技術發現

      1. 無編碼器設計能夠同時保留抽象語義與細粒度表征

      [圖像重建任務]

      我們先前的工作 NEO(Diao et al., ICLR 2026)表明,原生端到端模型同樣能夠學習到豐富的語義表征。在此基礎上,我們進一步觀察到一個有趣的現象:即使在凍結理解分支的情況下,獨立的生成分支仍然能夠從表示中抽取并恢復細粒度的視覺細節

      基于這一發現,我們訓練了 NEO-unify(2B)。在初步 9 萬步預訓練后,模型在 MS COCO 2017 上取得 31.56 PSNR0.85 SSIM,而 Flux VAE 的對應指標為 32.650.91。這一結果表明,即使不依賴預訓練 VEVAE近似無損的原生輸入仍能夠同時支持高質量的語義理解與像素級細節保真。

      域外圖像重建(2B NEO-unify,理解分支凍結)


      [圖像編輯任務]

      據此,我們進一步開展探索:NEO-unify 將所有全模態條件信息統一輸入到理解分支,而生成分支僅負責生成新的圖像。

      即使在凍結理解分支的情況下,NEO-unify(2B) 仍展現出強大的圖像編輯能力,同時顯著減少了輸入圖像令牌的數量。在使用開源生成與圖像編輯數據集并進行初步 6 萬步混合訓練后,模型在 ImgEdit 基準上取得 3.32 的成績,且理解分支在整個訓練過程中保持凍結

      小規模數據驗證(2B NEO-unify,理解分支凍結)


      ImgEdit提示詞編輯(2B NEO-unify,理解分支凍結)


      2. 無編碼器架構與 MoT 主干高度協同大幅降低內在沖突

      借助預訓練的理解分支與生成分支,NEO-unify 使用相同的中期訓練(MT)與 監督微調(SFT) 數據進行聯合訓練。即使在較低的數據比例和損失權重下,理解能力依然保持穩定,而生成能力則收斂很快。二者在 MoT 主干中協同提升,整體沖突極小。


      3. 無編碼器架構,展現更高數據訓練效率

      此外,我們首先進行 web-scale 預訓練,隨后在多樣且高質量的數據語料上依次進行中期訓練(MT) 和 監督微調(SFT)。與 Bagel 模型相比,NEO-unify 展現出更高的數據訓練效率,在使用更少訓練 token 的情況下取得了更優的性能。


      未來展望

      這不僅僅是一種模型架構探索,更是邁向下一代智能形態的一步:

      ? 感知與生成交織的閉環

      ? 全模態推理

      ? 視覺推理

      ? 空間智能

      ? 世界模型

      ? …

      一條新的路線圖正在展開:模型不再在模態之間進行轉換,而是能夠原生地跨模態思考。多模態 AI 不再只是連接不同系統,而是構建一個從未割裂的統一智能體,并讓所需能力從其內部自然涌現。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      61歲何智麗近照曝光,狀態判若兩人!日本銀行上班,想回上海養老

      61歲何智麗近照曝光,狀態判若兩人!日本銀行上班,想回上海養老

      喜歡歷史的阿繁
      2026-04-13 08:14:24
      人口大遷徙已悄然開啟!未來幾年,無數中國人命運或將徹底改寫!

      人口大遷徙已悄然開啟!未來幾年,無數中國人命運或將徹底改寫!

      小陸搞笑日常
      2026-04-12 17:54:18
      白人女性與黑人女性的體味差異,網友真實分享引發熱議

      白人女性與黑人女性的體味差異,網友真實分享引發熱議

      特約前排觀眾
      2025-12-22 00:20:06
      火箭3-0完勝灰熊:杜蘭特缺陣,灰熊七連敗分析

      火箭3-0完勝灰熊:杜蘭特缺陣,灰熊七連敗分析

      小鞄搞笑解說
      2026-04-13 01:05:20
      孫怡怒稱發布會是趙子琪淘汰會!宣布不當隊長,全網炸鍋

      孫怡怒稱發布會是趙子琪淘汰會!宣布不當隊長,全網炸鍋

      一盅情懷
      2026-04-12 15:56:31
      22歲甜妹公開示愛,王楚欽回應讓誰心碎?

      22歲甜妹公開示愛,王楚欽回應讓誰心碎?

      運動探索
      2026-04-13 09:29:35
      4月12日俄烏最新:轉折時刻

      4月12日俄烏最新:轉折時刻

      西樓飲月
      2026-04-12 16:18:11
      你最接近生理極限的一次經歷是什么?網友分享讓人目瞪口呆!

      你最接近生理極限的一次經歷是什么?網友分享讓人目瞪口呆!

      夜深愛雜談
      2026-04-09 19:39:13
      “戎馬倥傯 ”中的“倥傯 ”不讀kōng cōng, 正確讀音是什么?

      “戎馬倥傯 ”中的“倥傯 ”不讀kōng cōng, 正確讀音是什么?

      一口娛樂
      2026-04-11 18:54:47
      周錫瑋怒批蔣萬安:“解放了自有后來人收拾你!”

      周錫瑋怒批蔣萬安:“解放了自有后來人收拾你!”

      荊楚寰宇文樞
      2026-04-11 23:18:47
      命中了!以色列真干了!

      命中了!以色列真干了!

      財經要參
      2026-04-13 08:30:03
      溫瑞博4-2奪冠!逆轉原因曝光,誰注意他賽后一番話,展現高情商

      溫瑞博4-2奪冠!逆轉原因曝光,誰注意他賽后一番話,展現高情商

      體育就你秀
      2026-04-13 06:05:03
      43歲尼格買提逛集市被偶遇,這胸肌飽滿得十分吸睛

      43歲尼格買提逛集市被偶遇,這胸肌飽滿得十分吸睛

      今古深日報
      2026-04-13 10:11:47
      越南出新規!整治娛樂亂象:卡拉OK凌晨營業罰款加碼,老板們再也不敢“多賺一小時”

      越南出新規!整治娛樂亂象:卡拉OK凌晨營業罰款加碼,老板們再也不敢“多賺一小時”

      越南語學習平臺
      2026-04-13 09:52:47
      壞消息來了,他空降日本執教,薪資曝光,國乒將迎來生死強敵

      壞消息來了,他空降日本執教,薪資曝光,國乒將迎來生死強敵

      陳恧侃故事
      2026-04-13 01:14:16
      張雪峰被吐槽!一電力院校畢業生抱怨每月七八千元,收入未達預期

      張雪峰被吐槽!一電力院校畢業生抱怨每月七八千元,收入未達預期

      火山詩話
      2026-04-12 11:39:13
      大陸公布十項惠臺政策,民進黨當局擬封殺,港媒:臺灣產業界相當失望

      大陸公布十項惠臺政策,民進黨當局擬封殺,港媒:臺灣產業界相當失望

      海峽導報社
      2026-04-13 07:00:15
      以色列襲擊黎巴嫩被譴責,內塔尼亞胡:“以軍是世界上最有道德的軍隊”;此前以色列對黎巴嫩發動襲擊,造成包括兒童在內數百名平民死傷

      以色列襲擊黎巴嫩被譴責,內塔尼亞胡:“以軍是世界上最有道德的軍隊”;此前以色列對黎巴嫩發動襲擊,造成包括兒童在內數百名平民死傷

      揚子晚報
      2026-04-11 11:33:21
      她靠星光大道一炮而紅,卻因當小三前途盡毀,如今淪為了家庭主婦

      她靠星光大道一炮而紅,卻因當小三前途盡毀,如今淪為了家庭主婦

      觀察鑒娛
      2026-04-13 10:14:44
      萬斯演講:美國親手拆了自己建的世界,這是蘇聯解體后最大變局

      萬斯演講:美國親手拆了自己建的世界,這是蘇聯解體后最大變局

      通文知史
      2026-04-12 08:50:08
      2026-04-13 10:56:49
      開源中國 incentive-icons
      開源中國
      每天為開發者推送最新技術資訊
      7679文章數 34533關注度
      往期回顧 全部

      科技要聞

      李想向黑水軍開炮!連發5條朋友圈

      頭條要聞

      牛彈琴:談判失敗美國不惜自殘 用的招夠狠夠損也夠蠢

      頭條要聞

      牛彈琴:談判失敗美國不惜自殘 用的招夠狠夠損也夠蠢

      體育要聞

      創造歷史!五大聯賽首位女性主教練誕生

      娛樂要聞

      賭王女兒何超蕸病逝,常年和乳癌斗爭

      財經要聞

      封鎖,還是收費站?

      汽車要聞

      不止命名更純粹 領克10/10+要做純電操控新王

      態度原創

      本地
      手機
      健康
      數碼
      公開課

      本地新聞

      12噸巧克力有難,全網化身超級偵探添亂

      手機要聞

      華為Pura 90 Pro Max喜提麒麟9030 Pro:華為史上最強芯片 4月20日亮相

      干細胞抗衰4大誤區,90%的人都中招

      數碼要聞

      聯蕓將開發PCIe Gen6消費級SSD主控MAP2001,瞄準28GB/s

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版