品玩2月6日訊,據(jù)美團(tuán)官方消息,美團(tuán)正式發(fā)布了LongCat-Flash-Lite模型。該模型采用混合專家架構(gòu)的輕量化大模型,其總參數(shù)量為685億,但在每次推理時(shí)僅激活29億至45億參數(shù),從而實(shí)現(xiàn)了高效率。
官方宣稱其性能超越了參數(shù)量等效的基準(zhǔn)模型,并在同規(guī)模模型中展現(xiàn)出卓越的競(jìng)爭(zhēng)力。模型通過(guò)應(yīng)用YARN技術(shù),可支持長(zhǎng)達(dá)256K的上下文處理,能夠高效應(yīng)對(duì)長(zhǎng)文檔分析與大規(guī)模代碼處理等復(fù)雜場(chǎng)景。
在系統(tǒng)優(yōu)化方面,該模型顯著提升了推理效率。在典型的輸入輸出負(fù)載下,其生成速度可達(dá)每秒500至700個(gè)token。美團(tuán)同時(shí)宣布,將向開(kāi)發(fā)者開(kāi)放該模型的API接口。開(kāi)發(fā)者可登錄其開(kāi)放平臺(tái)申請(qǐng)使用,每日可獲得5000萬(wàn)token的免費(fèi)額度。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.