![]()
預(yù)訓(xùn)練、后訓(xùn)練等核心模塊暫未有大變化。
文丨陳佳惠
編輯丨程曼祺
《晚點(diǎn) LatePost》獨(dú)家獲悉,在上周林俊旸突然離職后,阿里在今天(3 月 9 日)下午有了新的管理安排:
Qwen 模型一號(hào)位由阿里云 CTO 和通義實(shí)驗(yàn)室負(fù)責(zé)人周靖人代管,他會(huì)深入了解模型發(fā)展需要的資源,提升各環(huán)節(jié)協(xié)作效率,確保模型高效迭代。
負(fù)責(zé) Qwen 預(yù)訓(xùn)練的劉大一恒,則將同時(shí)代管后訓(xùn)練和 Coding 團(tuán)隊(duì)。劉大一恒和 Qwen 模型團(tuán)隊(duì)的其他 leader 向周靖人匯報(bào)。
周靖人在 2015 年從微軟加入阿里巴巴,在 iDST 和達(dá)摩院帶過前沿技術(shù)研發(fā),也在螞蟻、淘寶做過實(shí)際業(yè)務(wù)落地。2022 年底,周靖人開始擔(dān)任阿里云 CTO 和通義實(shí)驗(yàn)室負(fù)責(zé)人。2025 年,周靖人晉升為阿里合伙人,進(jìn)入阿里最高集體決策機(jī)構(gòu)。在他的支持下,阿里選擇了開源模型生態(tài),并大力建設(shè)線上模型共享平臺(tái)魔搭社區(qū)(ModelScope)。
劉大一恒是 Qwen 團(tuán)隊(duì)的老成員。他本科和博士都畢業(yè)于四川大學(xué)計(jì)算機(jī)方向,2020 年入選 “天才少年” 計(jì)劃入職華為,2021 年加入阿里達(dá)摩院語言技術(shù)實(shí)驗(yàn)室,從 Qwen 早期就是核心成員,負(fù)責(zé)預(yù)訓(xùn)練。同事評(píng)價(jià)他有優(yōu)秀的數(shù)據(jù)能力,這是在小資源下提高訓(xùn)練成功率的關(guān)鍵之一。
Qwen 是阿里大模型的核心研發(fā)團(tuán)隊(duì),Qwen 的變化會(huì)影響一大批使用這個(gè)系列的學(xué)術(shù)機(jī)構(gòu)、研究者和創(chuàng)業(yè)公司。阿里此前已明確,會(huì)繼續(xù)堅(jiān)持開源策略。
相較之前 Qwen 團(tuán)隊(duì)的協(xié)作模式,最新的暫時(shí)管理安排依然保留了預(yù)訓(xùn)練、后訓(xùn)練和 coding 這樣的核心能力在同一個(gè)團(tuán)隊(duì)里的緊密協(xié)作,這部分相較過去的調(diào)整并不大。至于 Qwen 原本也在探索的視覺生成模型、語音模型和具身智能相關(guān)模型團(tuán)隊(duì)會(huì)如何調(diào)整,目前暫不明確。
題圖來源:Severance Season
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.