松果財經訊,面壁智能近日發布了一款基于全新稀疏-線性混合架構(SALA)的9B參數規模模型,在提升推理效率與降低計算成本方面取得重要突破。
![]()
SALA架構的核心在于將稀疏激活機制與線性變換路徑進行有機融合。與傳統密集模型在每次推理時激活全部參數不同,SALA通過動態路由策略,僅為特定輸入激活部分專家模塊,大幅降低了計算開銷。與此同時,模型中引入的線性計算路徑能夠高效處理通用特征,與稀疏專家模塊形成協同。
面壁智能團隊表示,這一設計使得9B模型在實際推理時的激活參數量僅相當于3B級別模型,卻保持了接近甚至超越同規模密集模型的性能表現。在語言理解、代碼生成與長文本處理等多項評測中,SALA-9B展現出優異的精度-效率平衡。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.