<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<tt id="mfjil"><style id="mfjil"></style></tt>

<table id="mfjil"></table>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

美團龍貓技術升級！新注意力機制速度快10倍，還能處理1M超長文本

2026-01-13 12:26:32　來源: 量子位

北京舉報

0

分享至

聞樂發自凹非寺
量子位 | 公眾號 QbitAI

256K文本預加載提速超50%，還解鎖了1M上下文窗口。

美團龍貓LongCat系列新年出招，發布全新稀疏注意力機制LoZA（LongCat ZigZag Attention）

新技術集中火力，重點解決長文本任務的理解、算力難題。

相比于LongCat系列之前的全注意力MLA機制，LoZA只改了一半的核心模塊。

但模型長文本能力從256K擴展到1M，解碼速度還快了不少。

甚至比同類型的Qwen-3模型表現還要好。

接下來看具體方案。

如何做到 “只算關鍵部分” ？

全注意力機制的算力瓶頸在于平方級的計算復雜度O (L2)，這導致模型在處理長文本任務時對顯卡要求高，還會出現推理延遲問題。

LoZA的核心思路是專注于處理重要的內容，不重要的部分少花力氣。

作為LongCat系列的核心技術升級，LoZA主要是在原來的MLA機制上做改造。

具體分兩步。

首先，給模型里的多頭潛在注意力模塊MLA做一個全局“篩查”，找出哪些模塊可以被改造。

在原來的MLA架構中，每個MLA模塊都是處理注意力的核心單元，現在的新方案是給每個模塊配一個可學習權重α。

α值越高，說明該模塊額全注意力計算越關鍵，一旦簡化就容易丟性能；α值越低就意味著模塊的可替代性強，即便換成更輕量的計算方式，對整體的理解能力影響也不大。

在訓練過程中，團隊凍結模型其他參數，只更新α的梯度，通過這種專門的校準訓練讓模型自主學習α值，然后按α值從小到大排序，找出那些稀疏化后不影響性能的MLA模塊，也就是后續的優化目標。

隨后，將找出的50%低性能模塊換成更輕巧的流式稀疏注意力SSA

這樣就形成了一種交錯結構，團隊將這種結構稱為ZigZag

SSA的計算復雜度是線性的O (L·S)（S為稀疏窗口大小，固定為1024Token），遠低于全注意力的O (L2)。

所以這種交錯結構讓模型既不會因為過度簡化而變笨，又能把計算復雜度降到線性級別，省不少算力。

為了讓模型在關注局部細節的基礎上不忽略整體邏輯，LoZA還設計了一個1024Token稀疏窗口

每個窗口里有1個負責抓整體關聯的“全局塊”和7個負責盯附近內容的“局部塊”，單塊大小為128Token。

這樣的改造也不需要從頭訓練，在中期訓練階段就能完成，成本也比較低。

從測試數據來看，LoZA的表現也不錯，主要是“更快”的同時“沒變笨”

速度上，要是處理128K上下文，解碼速度直接比原來快10倍；

256K上下文，模型預加載（讀文本過程）速度快了50%，后續解碼階段生成內容時還能省30%的算力，相當于同樣的硬件，現在能同時處理兩倍多的長文本任務。

這也讓LongCat-Flash-Exp解鎖了1M上下文窗口。

性能上，LoZA也沒因為簡化而縮水。

處理回答問題、寫代碼這類日常任務時，和原版LongCat-Flash持平；處理長文本任務時，表現反而更好。

比如在MRCR測試里，反超了同樣能處理1M長文本的Qwen-3模型，還更穩定。

接下來，團隊還計劃讓LoZA支持動態稀疏比例

短文本場景自動多用全注意力保證精度，長文本場景自動增加稀疏模塊提升效率，甚至適配多模態模型處理長視頻、長圖文內容。

好一個新年新氣象！

論文地址：https://www.alphaxiv.org/abs/2512.23966

— 完 —

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

梁文鋒署名新論文，DeepSeek V4架構首曝？直擊Transformer致命缺陷

新智元 2026-01-13 09:14:28
10 跟貼 10
清華團隊：1.5B 模型新基線！用「最笨」的 RL 配方達到頂尖性能

機器之心Pro 2025-11-13 14:56:23
0 跟貼 0

熱搜爆了！iOS微信通知能顯頭像，你更新體驗了嗎

雷科技 2026-01-12 22:44:52
59 跟貼 59

不上云、不租卡，如何優雅地在本地微調Qwen-VL-30B？

機器之心Pro 2026-01-13 12:57:27
0 跟貼 0
Anthropic深夜再出殺招！編碼AI一鍵清空桌面，白領末日來臨？

新智元 2026-01-13 13:15:58
0 跟貼 0

字節、阿里、美團罕見“會師”：自變量機器人獲10億元融資 2026年具身智競爭轉向

每日經濟新聞 2026-01-12 21:30:28
1 跟貼 1

國家及時出手了！

蜉蝣說 2026-01-13 10:50:55
0 跟貼 0
飛機票火車票怎么訂便宜？美團飛機票火車票優惠券領取方法攻略

瑪拉沁信息網 2026-01-13 13:25:10
0 跟貼 0

令人作嘔的外賣平臺！

老閆大實話 2026-01-12 11:39:52
4 跟貼 4
“電腦不賣、貨架不賣、電視不賣”，即將關閉的宜家門店多個貨架售罄，客服稱不再補貨

洪觀新聞 2026-01-12 15:51:02
1806 跟貼 1806
黃仁勛：中國的AI市場無論有沒有英偉達都會進步與華為是競爭對手不是敵人

財聯社 2025-07-21 10:22:14
7 跟貼 7
男孩用燒雞吸引鬼子注意力

搞笑影視吧 2026-01-10 09:14:05
4 跟貼 4
馬斯克最新訪談：瓦特是未來貨幣，電力優勢將令中國AI算力一騎絕塵

澎湃新聞 2026-01-13 04:52:26
403 跟貼 403
球場那些不可思議的驚人速度

伊昂日記 2026-01-12 21:45:53
0 跟貼 0
車企賦能文旅的天花板！捷途這波操作太秀了

阿貴說車 2026-01-12 16:15:55
4 跟貼 4
丈夫偷拿老婆嫁妝錢，婆家的思維邏輯毀三觀，最終自食惡果

王小花動畫 2026-01-11 14:34:00
0 跟貼 0
PS6技術下放?PS5Pro獨占功能升級來了?或助力GTA6

游民星空 2026-01-13 12:07:13
1 跟貼 1
拆解AI黑箱，深度解讀“機制可解釋性”｜2026年十大突破性技術

DeepTech深科技 2026-01-13 13:53:20
0 跟貼 0
100年后，外賣員全都變成了機器人，再也沒有人類送外賣，短片

火影電影 2026-01-09 17:55:11
5 跟貼 5
女子用外賣卡片點餐，外賣員送達時撕掉小票

中安在線 2026-01-12 20:22:11
0 跟貼 0
比亞迪王傳福：做大產業，做出中國制造業應有的位置

每日經濟新聞 2025-07-22 17:51:59
15 跟貼 15
余承東：我有一個夢想馬路上的所有車里都有華為的技術

每日經濟新聞 2025-07-23 17:06:16
331 跟貼 331
特朗普稱格陵蘭周圍都是中國船只丹麥官員：純屬妄想

澎湃新聞 2026-01-13 08:47:23
1260 跟貼 1260
湖北帥哥李鑫去世，年僅27歲，騎機車速度太快導致，新房剛裝修好

180視角 2026-01-13 08:56:12
3 跟貼 3
女孩送外賣一年存下5萬元，每天工作10小時，每月只休息2天

YK大遼河 2026-01-12 11:19:06
13 跟貼 13
丈母娘被無人機外賣硬控了

珠莉婭JuliaChen 2026-01-09 17:41:12
6 跟貼 6
房價浮動有下限？天津市住建部門召集房企商量

每日經濟新聞 2026-01-13 01:04:26
2094 跟貼 2094
谷歌被選定為蘋果新款Siri合作方市值破4萬億美元

界面新聞 2026-01-13 08:51:51
107 跟貼 107
打敗出租車的，不是摩的跟滴滴，而是外賣騎手

今天吃幾碗 2026-01-10 18:56:52
1 跟貼 1
配送員無奈！外賣給顧客吃完后申請僅退款，上門取證只剩下空盒！

貓咪妞妞 2026-01-13 03:48:51
0 跟貼 0
一路向南，告別Z99次列車！

新民晚報 2026-01-12 13:23:24
665 跟貼 665
4名專家因送餐延誤致身體不適拒評標！是太嬌貴，還是另有隱情？

慢半拍sir 2026-01-13 11:21:48
1 跟貼 1
初中數學已知方程有解求參數范圍

天天數理學習分享 2026-01-12 09:28:20
1 跟貼 1
美團外賣男濟南街頭乞討，稱女兒患白血病籌錢，遭質疑無言以對

搞笑小搗蛋 2026-01-13 00:00:00
0 跟貼 0
哥們兒，錢不是這么賺的

抓馬娛樂圈star 2026-01-13 01:23:51
1 跟貼 1
小哥看街邊美女直播，外賣也不送了

青果視頻 2026-01-10 14:58:42
10 跟貼 10
電網設備股異動拉升三變科技、特變電工雙雙直線漲停

財聯社 2026-01-13 13:52:06
0 跟貼 0
我就點個外賣，要什么鞋碼啊

喜蕃影視 2026-01-12 10:24:46
1 跟貼 1
“2026年第一個闖大禍的人”，如何制造了“千人赴約殺豬宴”的網絡狂歡

新民周刊 2026-01-12 19:26:19
617 跟貼 617
兒子去幫媽媽拿外賣，得知是給自己買的后要求媽媽折現，網友：眼里沒有對奶茶的渴望，全是想將奶茶折現的

趣聞焦點 2026-01-12 17:18:06
0 跟貼 0

吸毒、行納粹禮、使用“猶太豬”…德軍精銳丑聞令人“瞠目結舌”

吸毒、行納粹禮、使用“猶太豬”…德軍精銳丑聞令人“瞠目結舌”

觀察者網

2026-01-12 15:30:07

陳夢談出演電視劇：本來想探班黃曉明，結果探成了客串

陳夢談出演電視劇：本來想探班黃曉明，結果探成了客串

懂球帝

2026-01-12 20:25:15

被錘“賣屁股換資源”，自曝大瓜反轉全網！

被錘“賣屁股換資源”，自曝大瓜反轉全網！

毒舌八卦

2026-01-12 20:50:53

誰能想到，馬云對美團王興的復仇，一等就是整整十年

誰能想到，馬云對美團王興的復仇，一等就是整整十年

流蘇晚晴

2025-12-29 18:31:44

著名音樂家、指揮家劉鍵逝世，曾因在街頭見義勇為為人所熟知

著名音樂家、指揮家劉鍵逝世，曾因在街頭見義勇為為人所熟知

澎湃新聞

2026-01-11 18:58:27

湖人112-124不敵背靠背國王，東契奇42+7+8，詹姆斯22分，威少22+7

湖人112-124不敵背靠背國王，東契奇42+7+8，詹姆斯22分，威少22+7

懂球帝

2026-01-13 14:11:03

向太曝馬伊琍已再婚：當年文章過不了心理那關

向太曝馬伊琍已再婚：當年文章過不了心理那關

娛樂看阿敞

2025-12-12 15:50:00

閆學晶道歉不到24小時，擔心的一幕還是發生了，輿論反撲更加猛烈

閆學晶道歉不到24小時，擔心的一幕還是發生了，輿論反撲更加猛烈

娛說瑜悅

2026-01-12 17:22:14

進口藥突然買不到了，價格翻幾倍誰來管？

進口藥突然買不到了，價格翻幾倍誰來管？

寶哥精彩賽事

2026-01-12 07:32:01

東風導彈泄密案：間諜郭萬鈞一家三口，全部被處以死刑

東風導彈泄密案：間諜郭萬鈞一家三口，全部被處以死刑

冰點歷史

2025-07-15 09:33:13

趙玉吉：72歲央企老總，給巴圖當了26年爹

趙玉吉：72歲央企老總，給巴圖當了26年爹

家味美味道

2026-01-13 10:16:25

86年我放走一個越南女兵，33年后我剛出越南機場就被一排軍車接走

86年我放走一個越南女兵，33年后我剛出越南機場就被一排軍車接走

蕭竹輕語

2025-12-05 17:38:25

韓國突然補刀！訪華回去的李在明，跟隨中國鐵拳，或重啟去日本化

韓國突然補刀！訪華回去的李在明，跟隨中國鐵拳，或重啟去日本化

小陳講史

2026-01-12 17:17:28

中科院院士：青年科學家 5 年內拿不出成果就面臨淘汰，有的單位已現「馬太」效應，重復給某一人獎勵

中科院院士：青年科學家 5 年內拿不出成果就面臨淘汰，有的單位已現「馬太」效應，重復給某一人獎勵

化學人生

2026-01-12 20:54:44

比福建艦還大！4艘萬噸巨船同時出塢，美這才明白，輸給中國了

比福建艦還大！4艘萬噸巨船同時出塢，美這才明白，輸給中國了

來科點譜

2026-01-13 08:59:18

“2299元羽絨服充絨僅86克”背后：多個品牌商務羽絨服充絨量低于100克有的僅55克，商務款通常比普通款充絨量低

“2299元羽絨服充絨僅86克”背后：多個品牌商務羽絨服充絨量低于100克有的僅55克，商務款通常比普通款充絨量低

極目新聞

2026-01-12 11:45:51

明搶5000萬桶石油后，特朗普傻眼：中國連一桶美國油都不肯買了

明搶5000萬桶石油后，特朗普傻眼：中國連一桶美國油都不肯買了

太陽曬社會

2026-01-13 12:07:58

四川高縣一村支書暴打殘疾村婦致輕傷二級！法院：免于刑事處罰！

四川高縣一村支書暴打殘疾村婦致輕傷二級！法院：免于刑事處罰！

兵叔評說

2026-01-07 12:13:15

剛剛，蘋果官宣 iPhone 將搭載最強 AI！馬斯克第一個跳出來罵

剛剛，蘋果官宣 iPhone 將搭載最強 AI！馬斯克第一個跳出來罵

AppSo

2026-01-13 04:47:57

秦志戩驚喜回歸！國乒總教練黑馬誕生，劉國梁愛將重掌帥印

秦志戩驚喜回歸！國乒總教練黑馬誕生，劉國梁愛將重掌帥印

卿子書

2026-01-13 13:41:31

追蹤人工智能動態

12007文章數 176358關注度

往期回顧全部

科技要聞

每年10億美元！谷歌大模型注入Siri

頭條要聞

59歲女子誕下男嬰：大女兒定居國外我和丈夫感到寂寞

頭條要聞

59歲女子誕下男嬰：大女兒定居國外我和丈夫感到寂寞

體育要聞

CBA還能眾籌換帥？

娛樂要聞

周杰倫以球員身份參加澳網，C位海報公開

財經要聞

中國一口氣申報20萬顆衛星，意味著什么？

汽車要聞

限時9.99萬元起 2026款啟辰大V DD-i虎鯨上市

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

親子

旅游

時尚

游戲

房產

親子要聞

您吸的每一支煙，透支孩子的健康

旅游要聞

“野趣”花岙（嶼見中國）

走過那個夏天，甜茶終于站上金球獎之巔

黑旗&波斯王子RE真要來了？網站瘋狂更新！

房產要聞

重磅調規！417畝商改住+教育地塊！海口西海岸又要爆發！

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：国产免费久久精品99reswag| 国产真实乱人偷精品人妻| 91色在线视频| 无码人妻一区二区三区麻豆| 亚洲综合无码一区二区三区| 少妇被爽到高潮喷水久久欧美精品 | 熟女精品| 美女大bxxxxn内射| 精品国产午夜福利在线观看| 邻居少妇张开腿让我爽了在线观看| 欧美性猛少妇xxxxx免费| 保靖县| 国产精品久久久久免费观看| www熟女com| 久久久久亚洲AV成人网人人小说| 久久日产一线二线三线| 最新久久成人国产精品视频免费| 成人视频在线观看18| 中日韩中文字幕一区二区| 亚洲国产av无码精品无广告| 婷婷综合五月| 2021最新国产精品网站| 国产制服丝袜在线| 九九成人在线| 日韩AV一区二区三区四区| 脱岳裙子从后面挺进去在线观看| 四虎永久免费高清视频| 一区二区在线 | 中国| 九九国产精品无码免费视频| 国产内射一区亚洲| 揉捏奶头高潮呻吟视频| 沁水县| 无限看片在线版免费视频大全 | 久久综合九色综合欧洲98| 青草99在线免费观看| 欧洲亚洲欧美国产日本高清| 日本色色| 中文字幕一区二区三区乱码不卡 | 黄山市| 中文字幕亚洲一区二区va在线 | 久久青青草原精品国产app|

<thead id="osvai"></thead>

<nav id="osvai"><strong id="osvai"></strong></nav>