來(lái)源:@首席數(shù)智官
9月19日,在2024杭州云棲大會(huì)上,阿里云CTO周靖人表示,阿里云正在圍繞AI時(shí)代,樹立一個(gè)AI基礎(chǔ)設(shè)施的新標(biāo)準(zhǔn),全面升級(jí)從服務(wù)器到計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、數(shù)據(jù)處理、模型訓(xùn)練和推理平臺(tái)的技術(shù)架構(gòu)體系,讓數(shù)據(jù)中心成為一臺(tái)超級(jí)計(jì)算機(jī),為每個(gè)AI和應(yīng)用提供高性能、高效的算力服務(wù)。
![]()
大會(huì)現(xiàn)場(chǎng),通義大模型迎來(lái)了年度重磅發(fā)布。基礎(chǔ)模型升級(jí),性能媲美GPT-4o,發(fā)布最強(qiáng)開源模型Qwen2.5系列,同時(shí)上架語(yǔ)言、音頻、視覺等100多款全模態(tài)模型,通義開源模型累計(jì)下載量已經(jīng)突破4000萬(wàn),通義原生模型和衍生模型總數(shù)超過(guò)5萬(wàn),成為僅次于美國(guó)Llama的世界級(jí)模型群。
01 通義千問(wèn)升級(jí)旗艦?zāi)P蚎wen-Max,性能接近GPT-4o
阿里云CTO周靖人宣布,通義旗艦?zāi)P蚎wen-Max全方位升級(jí),性能接近GPT-4o。通義官網(wǎng)和通義APP的后臺(tái)模型均已切換為Qwen-Max,繼續(xù)免費(fèi)為所有用戶提供服務(wù)。用戶也可通過(guò)阿里云百煉平臺(tái)調(diào)用Qwen-Max的API。
相比上一代模型,Qwen-Max在訓(xùn)練中使用了更多的訓(xùn)練數(shù)據(jù)、更大的模型規(guī)模、更強(qiáng)的人類對(duì)齊,最終達(dá)到了更高的智能水平。在MMLU-Pro、MATH、GSM8K、MBPP、MultiPL-E、LiveCodeBench等十多個(gè)權(quán)威基準(zhǔn)上,Qwen-Max表現(xiàn)接近GPT-4o,數(shù)學(xué)能力、代碼能力則超越了GPT-4o。數(shù)學(xué)和代碼所代表的推理能力是大模型智能水平的最重要體現(xiàn)。
![]()
相比2023年4月的初代通義千問(wèn)大模型,Qwen-Max的理解能力提升46%、數(shù)學(xué)能力提升75%、代碼能力提升102%、幻覺抵御能力提升35%、指令遵循能力提升105%,模型與人類偏好的對(duì)齊水平更是有了質(zhì)的飛躍,提升了700%以上。
02 通義千問(wèn)重磅開源Qwen2.5,性能超越Llama
阿里云CTO周靖人發(fā)布通義千問(wèn)新一代開源模型Qwen2.5,旗艦?zāi)P蚎wen2.5-72B性能超越Llama 405B,再登全球開源大模型王座。Qwen2.5全系列涵蓋多個(gè)尺寸的大語(yǔ)言模型、多模態(tài)模型、數(shù)學(xué)模型和代碼模型,每個(gè)尺寸都有基礎(chǔ)版本、指令跟隨版本、量化版本,總計(jì)上架100多個(gè)模型,刷新業(yè)界紀(jì)錄。
![]()
Qwen2.5全系列模型都在18T tokens數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練,相比Qwen2,整體性能提升18%以上,擁有更多的知識(shí)、更強(qiáng)的編程和數(shù)學(xué)能力。Qwen2.5-72B模型在MMLU-rudex基準(zhǔn)(考察通用知識(shí))、MBPP 基準(zhǔn)(考察代碼能力)和MATH基準(zhǔn)(考察數(shù)學(xué)能力)的得分高達(dá)86.8、88.2、83.1。
Qwen2.5支持高達(dá)128K的上下文長(zhǎng)度,可生成最多8K內(nèi)容。模型擁有強(qiáng)大的多語(yǔ)言能力,支持中文、英文、法文、西班牙文、俄文、日文、越南文、阿拉伯文等 29 種以上語(yǔ)言。模型能夠絲滑響應(yīng)多樣化的系統(tǒng)提示,實(shí)現(xiàn)角色扮演和聊天機(jī)器人等任務(wù)。在指令跟隨、理解結(jié)構(gòu)化數(shù)據(jù)(如表格)、生成結(jié)構(gòu)化輸出(尤其是JSON)等方面Qwen2.5都進(jìn)步明顯。
語(yǔ)言模型方面,Qwen2.5開源了7個(gè)尺寸,0.5B、1.5B、3B、7B、14B、32B、72B,它們?cè)谕葏?shù)賽道都創(chuàng)造了業(yè)界最佳成績(jī),型號(hào)設(shè)定充分考慮下游場(chǎng)景的不同需求,3B是適配手機(jī)等端側(cè)設(shè)備的黃金尺寸;32B是最受開發(fā)者期待的“性價(jià)比之王”,可在性能和功耗之間獲得最佳平衡,Qwen2.5-32B的整體表現(xiàn)超越了Qwen2-72B。
在MMLU-redux等十多個(gè)基準(zhǔn)測(cè)評(píng)中,Qwen2.5-72B表現(xiàn)超越Llama3.1-405B
72B是Qwen2.5系列的旗艦?zāi)P停渲噶罡S版本Qwen2.5-72B-Instruct在MMLU-redux、MATH、MBPP、LiveCodeBench、Arena-Hard、AlignBench、MT-Bench、MultiPL-E等權(quán)威測(cè)評(píng)中表現(xiàn)出色,在多個(gè)核心任務(wù)上,以不到1/5的參數(shù)超越了擁有4050億巨量參數(shù)的Llama3.1-405B,繼續(xù)穩(wěn)居“全球最強(qiáng)開源大模型”的位置。
專項(xiàng)模型方面,用于編程的 Qwen2.5-Coder 和用于數(shù)學(xué)的 Qwen2.5-Math都比前代有了實(shí)質(zhì)性進(jìn)步。Qwen2.5-Coder 在多達(dá)5.5T tokens 的編程相關(guān)數(shù)據(jù)上作了訓(xùn)練,當(dāng)天開源1.5B和7B版本,未來(lái)還將開源32B版本;Qwen2.5-Math支持使用思維鏈和工具集成推理(TIR) 解決中英雙語(yǔ)的數(shù)學(xué)題,是迄今為止最先進(jìn)的開源數(shù)學(xué)模型系列,本次開源了1.5B、7B、72B三個(gè)尺寸和一款數(shù)學(xué)獎(jiǎng)勵(lì)模型Qwen2.5-Math-RM。
多模態(tài)模型方面,廣受期待的視覺語(yǔ)言模型Qwen2-VL-72B正式開源,Qwen2-VL能識(shí)別不同分辨率和長(zhǎng)寬比的圖片,理解20分鐘以上長(zhǎng)視頻,具備自主操作手機(jī)和機(jī)器人的視覺智能體能力。日前權(quán)威測(cè)評(píng)LMSYS Chatbot Arena Leaderboard發(fā)布最新一期的視覺模型性能測(cè)評(píng)結(jié)果,Qwen2-VL-72B成為全球得分最高的開源模型。
![]()
Qwen2-VL-72B在權(quán)威測(cè)評(píng)LMSYS Chatbot Arena Leaderboard成為成為全球得分最高的開源視覺理解模型
自從2023年8月開源以來(lái),通義在全球開源大模型領(lǐng)域后來(lái)居上,成為開發(fā)者尤其是中國(guó)開發(fā)者的首選模型。性能上,通義大模型日拱一卒,逐步趕超美國(guó)最強(qiáng)開源模型Llama,多次登頂Hugging Face全球大模型榜單;生態(tài)上,通義從零起步、開疆拓土,與海內(nèi)外的開源社區(qū)、生態(tài)伙伴、開發(fā)者共建生態(tài)網(wǎng)絡(luò),截至2024年9月中旬,通義千問(wèn)開源模型下載量突破4000萬(wàn),Qwen系列衍生模型總數(shù)超過(guò)5萬(wàn)個(gè),成為僅次于Llama的世界級(jí)模型群。
HuggingFace數(shù)據(jù)顯示,截至9月中旬Qwen系列原生模型和衍生模型總數(shù)超過(guò)5萬(wàn)個(gè)
03 通義萬(wàn)相發(fā)布視頻生成模型,可一鍵創(chuàng)作影視級(jí)高清視頻
阿里云CTO周靖人宣布通義萬(wàn)相全面升級(jí),并發(fā)布全新視頻生成模型,可生成影視級(jí)高清視頻,可應(yīng)用于影視創(chuàng)作、動(dòng)畫設(shè)計(jì)、廣告設(shè)計(jì)等領(lǐng)域。即日起,所有用戶可通過(guò)通義APP及通義萬(wàn)相官網(wǎng)免費(fèi)體驗(yàn)。
據(jù)介紹,通義萬(wàn)相首批上線文生視頻、圖生視頻功能,在文生視頻功能中,用戶輸入任意文字提示詞,即可生成一段高清視頻,支持中英文多語(yǔ)言輸入,并可以通過(guò)靈感擴(kuò)寫功能智能豐富視頻內(nèi)容表現(xiàn)力,支持16:9、9:16等多種比例生成;在圖生視頻功能中,支持用戶將任意圖片轉(zhuǎn)化為動(dòng)態(tài)視頻,按照上傳的圖像比例或預(yù)設(shè)比例進(jìn)行生成,同時(shí)可以通過(guò)提示詞來(lái)控制視頻運(yùn)動(dòng)。
現(xiàn)場(chǎng),阿里云演示了該模型強(qiáng)大的運(yùn)動(dòng)生成和概念組合能力,輸入「穿著滑冰鞋的小兔子在冰面上靈活移動(dòng)的可愛場(chǎng)景」,通義萬(wàn)相僅用數(shù)分鐘就能生成一段高清、逼真的視頻。
通義萬(wàn)相視頻生成大模型集成了多項(xiàng)創(chuàng)新技術(shù),有效解決畫面表現(xiàn)力和大幅度運(yùn)動(dòng)等視頻生成技術(shù)難題。針對(duì)運(yùn)動(dòng)生成和物理模擬等難點(diǎn)優(yōu)化算法,實(shí)現(xiàn)了大幅度主體運(yùn)動(dòng)和運(yùn)鏡控制,并有效模擬真實(shí)世界物理特性;設(shè)計(jì)了高壓縮比、高質(zhì)量視頻VAE框架,有效降低視頻信息冗余,并保持高質(zhì)量視頻重構(gòu)能力;同時(shí),基于輕量微調(diào)框架和精選數(shù)據(jù)集優(yōu)化訓(xùn)練,在中式傳統(tǒng)元素、風(fēng)格化視頻生成上表現(xiàn)更好。
去年7月,通義萬(wàn)相圖像生成大模型首次亮相,目前已累計(jì)生成7500萬(wàn)張圖片。云棲大會(huì)現(xiàn)場(chǎng),通義萬(wàn)相宣布視覺生成大模型全面升級(jí)為Diffusion Transformer框架,同時(shí)結(jié)合通義千問(wèn)復(fù)雜提示詞解釋能力,有效提升畫面表現(xiàn)力、語(yǔ)義理解能力、可控生成能力。隨著通義萬(wàn)相視頻生成模型的發(fā)布,通義大模型已覆蓋文本生成、圖像理解、視頻理解、音頻理解、圖像生成、視頻生成等全模態(tài)場(chǎng)景。
04 通義靈碼AI編程能力再進(jìn)化,說(shuō)幾句話就能開發(fā)網(wǎng)頁(yè)
隨著通義大模型能力的全面提升,阿里云通義靈碼迎來(lái)重磅升級(jí),從一年前只能完成基礎(chǔ)的輔助編程任務(wù),進(jìn)化到幾句話就能完成需求理解、任務(wù)拆解、代碼編寫、修改BUG、測(cè)試等開發(fā)任務(wù),最快幾分鐘可從0到1完成應(yīng)用開發(fā),提升數(shù)十倍開發(fā)效率。
自去年首次亮相以來(lái),通義靈碼已入職中華財(cái)險(xiǎn)、哈啰集團(tuán)、長(zhǎng)安汽車等公司,累計(jì)生成代碼超10億行,是國(guó)內(nèi)最受歡迎的輔助編程工具。全新升級(jí)的通義靈碼模擬了人類程序員的能力,可完成更復(fù)雜、更全面的任務(wù);通義靈碼還可以脫離專業(yè)IDE軟件,在web端直接執(zhí)行缺陷修改、需求分析、代碼實(shí)現(xiàn)、問(wèn)題排查等任務(wù)工作流,兼具架構(gòu)師、開發(fā)工程師、測(cè)試工程師等多種崗位技能,大幅縮短了應(yīng)用的開發(fā)周期。
例如,真人程序員手動(dòng)開發(fā)一個(gè)網(wǎng)頁(yè),通常需要1天的時(shí)間完成需求分解、寫代碼、測(cè)試等任務(wù);現(xiàn)在,人類只需要輸入需求,通義靈碼5分鐘就能完成整個(gè)過(guò)程。阿里云表示,未來(lái)只要有創(chuàng)意,不懂代碼也能開發(fā)應(yīng)用和軟件。
云棲大會(huì)現(xiàn)場(chǎng),一位13歲的中學(xué)生在通義靈碼上輸入幾句話,2分鐘就生成了一個(gè)python語(yǔ)言編寫的倒計(jì)時(shí)網(wǎng)頁(yè);現(xiàn)場(chǎng)還有參會(huì)者,用通義靈碼修改開源魂斗羅游戲代碼,在9個(gè)代碼文件2000多行代碼里,幾分鐘就精準(zhǔn)修改了游戲角色的生命值、跳躍高度等參數(shù)。
目前,通義靈碼已廣泛應(yīng)用于金融、制造、互聯(lián)網(wǎng)、交通、汽車、能源等行業(yè)。在 Gartner 首個(gè)AI代碼助手魔力象限報(bào)告中,阿里云成為唯一進(jìn)入挑戰(zhàn)者象限的中國(guó)科技公司。
百模大戰(zhàn)一年后,應(yīng)用成為了大模型產(chǎn)業(yè)的主旋律。作為最早提出模型即服務(wù)(MaaS)理念的企業(yè),阿里云一直把大模型生態(tài)的繁榮作為首要目標(biāo)。目前,魔搭社區(qū)已成為中國(guó)最大的模型社區(qū),擁有超690萬(wàn)開發(fā)者用戶,與行業(yè)合作伙伴合作貢獻(xiàn)了超10000款模型。
“我們希望企業(yè)和開發(fā)者能以最低的成本做AI、用AI,讓所有人都能用上最先進(jìn)的大模型。”周靖人說(shuō)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.