網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

阿里云CTO：通義穩(wěn)居全球最強(qiáng)開源大模型，性能接近GPT-4o

2024-09-19 22:54:17　來(lái)源: 首席數(shù)智官

浙江舉報(bào)

分享至

來(lái)源：@首席數(shù)智官

9月19日，在2024杭州云棲大會(huì)上，阿里云CTO周靖人表示，阿里云正在圍繞AI時(shí)代，樹立一個(gè)AI基礎(chǔ)設(shè)施的新標(biāo)準(zhǔn)，全面升級(jí)從服務(wù)器到計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、數(shù)據(jù)處理、模型訓(xùn)練和推理平臺(tái)的技術(shù)架構(gòu)體系，讓數(shù)據(jù)中心成為一臺(tái)超級(jí)計(jì)算機(jī)，為每個(gè)AI和應(yīng)用提供高性能、高效的算力服務(wù)。

大會(huì)現(xiàn)場(chǎng)，通義大模型迎來(lái)了年度重磅發(fā)布。基礎(chǔ)模型升級(jí)，性能媲美GPT-4o，發(fā)布最強(qiáng)開源模型Qwen2.5系列，同時(shí)上架語(yǔ)言、音頻、視覺等100多款全模態(tài)模型，通義開源模型累計(jì)下載量已經(jīng)突破4000萬(wàn)，通義原生模型和衍生模型總數(shù)超過(guò)5萬(wàn)，成為僅次于美國(guó)Llama的世界級(jí)模型群。

01 通義千問(wèn)升級(jí)旗艦?zāi)Ｐ蚎wen-Max，性能接近GPT-4o

阿里云CTO周靖人宣布，通義旗艦?zāi)Ｐ蚎wen-Max全方位升級(jí)，性能接近GPT-4o。通義官網(wǎng)和通義APP的后臺(tái)模型均已切換為Qwen-Max，繼續(xù)免費(fèi)為所有用戶提供服務(wù)。用戶也可通過(guò)阿里云百煉平臺(tái)調(diào)用Qwen-Max的API。

相比上一代模型，Qwen-Max在訓(xùn)練中使用了更多的訓(xùn)練數(shù)據(jù)、更大的模型規(guī)模、更強(qiáng)的人類對(duì)齊，最終達(dá)到了更高的智能水平。在MMLU-Pro、MATH、GSM8K、MBPP、MultiPL-E、LiveCodeBench等十多個(gè)權(quán)威基準(zhǔn)上，Qwen-Max表現(xiàn)接近GPT-4o，數(shù)學(xué)能力、代碼能力則超越了GPT-4o。數(shù)學(xué)和代碼所代表的推理能力是大模型智能水平的最重要體現(xiàn)。

相比2023年4月的初代通義千問(wèn)大模型，Qwen-Max的理解能力提升46%、數(shù)學(xué)能力提升75%、代碼能力提升102%、幻覺抵御能力提升35%、指令遵循能力提升105%，模型與人類偏好的對(duì)齊水平更是有了質(zhì)的飛躍，提升了700%以上。

02 通義千問(wèn)重磅開源Qwen2.5，性能超越Llama

阿里云CTO周靖人發(fā)布通義千問(wèn)新一代開源模型Qwen2.5，旗艦?zāi)Ｐ蚎wen2.5-72B性能超越Llama 405B，再登全球開源大模型王座。Qwen2.5全系列涵蓋多個(gè)尺寸的大語(yǔ)言模型、多模態(tài)模型、數(shù)學(xué)模型和代碼模型，每個(gè)尺寸都有基礎(chǔ)版本、指令跟隨版本、量化版本，總計(jì)上架100多個(gè)模型，刷新業(yè)界紀(jì)錄。

Qwen2.5全系列模型都在18T tokens數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練，相比Qwen2，整體性能提升18%以上，擁有更多的知識(shí)、更強(qiáng)的編程和數(shù)學(xué)能力。Qwen2.5-72B模型在MMLU-rudex基準(zhǔn)（考察通用知識(shí)）、MBPP 基準(zhǔn)（考察代碼能力）和MATH基準(zhǔn)（考察數(shù)學(xué)能力）的得分高達(dá)86.8、88.2、83.1。

Qwen2.5支持高達(dá)128K的上下文長(zhǎng)度，可生成最多8K內(nèi)容。模型擁有強(qiáng)大的多語(yǔ)言能力，支持中文、英文、法文、西班牙文、俄文、日文、越南文、阿拉伯文等 29 種以上語(yǔ)言。模型能夠絲滑響應(yīng)多樣化的系統(tǒng)提示，實(shí)現(xiàn)角色扮演和聊天機(jī)器人等任務(wù)。在指令跟隨、理解結(jié)構(gòu)化數(shù)據(jù)（如表格）、生成結(jié)構(gòu)化輸出（尤其是JSON）等方面Qwen2.5都進(jìn)步明顯。

語(yǔ)言模型方面，Qwen2.5開源了7個(gè)尺寸，0.5B、1.5B、3B、7B、14B、32B、72B，它們?cè)谕葏?shù)賽道都創(chuàng)造了業(yè)界最佳成績(jī)，型號(hào)設(shè)定充分考慮下游場(chǎng)景的不同需求，3B是適配手機(jī)等端側(cè)設(shè)備的黃金尺寸；32B是最受開發(fā)者期待的“性價(jià)比之王”，可在性能和功耗之間獲得最佳平衡，Qwen2.5-32B的整體表現(xiàn)超越了Qwen2-72B。

在MMLU-redux等十多個(gè)基準(zhǔn)測(cè)評(píng)中，Qwen2.5-72B表現(xiàn)超越Llama3.1-405B

72B是Qwen2.5系列的旗艦?zāi)Ｐ停渲噶罡S版本Qwen2.5-72B-Instruct在MMLU-redux、MATH、MBPP、LiveCodeBench、Arena-Hard、AlignBench、MT-Bench、MultiPL-E等權(quán)威測(cè)評(píng)中表現(xiàn)出色，在多個(gè)核心任務(wù)上，以不到1/5的參數(shù)超越了擁有4050億巨量參數(shù)的Llama3.1-405B，繼續(xù)穩(wěn)居“全球最強(qiáng)開源大模型”的位置。

專項(xiàng)模型方面，用于編程的 Qwen2.5-Coder 和用于數(shù)學(xué)的 Qwen2.5-Math都比前代有了實(shí)質(zhì)性進(jìn)步。Qwen2.5-Coder 在多達(dá)5.5T tokens 的編程相關(guān)數(shù)據(jù)上作了訓(xùn)練，當(dāng)天開源1.5B和7B版本，未來(lái)還將開源32B版本；Qwen2.5-Math支持使用思維鏈和工具集成推理（TIR）解決中英雙語(yǔ)的數(shù)學(xué)題，是迄今為止最先進(jìn)的開源數(shù)學(xué)模型系列，本次開源了1.5B、7B、72B三個(gè)尺寸和一款數(shù)學(xué)獎(jiǎng)勵(lì)模型Qwen2.5-Math-RM。

多模態(tài)模型方面，廣受期待的視覺語(yǔ)言模型Qwen2-VL-72B正式開源，Qwen2-VL能識(shí)別不同分辨率和長(zhǎng)寬比的圖片，理解20分鐘以上長(zhǎng)視頻，具備自主操作手機(jī)和機(jī)器人的視覺智能體能力。日前權(quán)威測(cè)評(píng)LMSYS Chatbot Arena Leaderboard發(fā)布最新一期的視覺模型性能測(cè)評(píng)結(jié)果,Qwen2-VL-72B成為全球得分最高的開源模型。

Qwen2-VL-72B在權(quán)威測(cè)評(píng)LMSYS Chatbot Arena Leaderboard成為成為全球得分最高的開源視覺理解模型

自從2023年8月開源以來(lái)，通義在全球開源大模型領(lǐng)域后來(lái)居上，成為開發(fā)者尤其是中國(guó)開發(fā)者的首選模型。性能上，通義大模型日拱一卒，逐步趕超美國(guó)最強(qiáng)開源模型Llama，多次登頂Hugging Face全球大模型榜單；生態(tài)上，通義從零起步、開疆拓土，與海內(nèi)外的開源社區(qū)、生態(tài)伙伴、開發(fā)者共建生態(tài)網(wǎng)絡(luò)，截至2024年9月中旬，通義千問(wèn)開源模型下載量突破4000萬(wàn)，Qwen系列衍生模型總數(shù)超過(guò)5萬(wàn)個(gè)，成為僅次于Llama的世界級(jí)模型群。

HuggingFace數(shù)據(jù)顯示，截至9月中旬Qwen系列原生模型和衍生模型總數(shù)超過(guò)5萬(wàn)個(gè)

03 通義萬(wàn)相發(fā)布視頻生成模型，可一鍵創(chuàng)作影視級(jí)高清視頻

阿里云CTO周靖人宣布通義萬(wàn)相全面升級(jí)，并發(fā)布全新視頻生成模型，可生成影視級(jí)高清視頻，可應(yīng)用于影視創(chuàng)作、動(dòng)畫設(shè)計(jì)、廣告設(shè)計(jì)等領(lǐng)域。即日起，所有用戶可通過(guò)通義APP及通義萬(wàn)相官網(wǎng)免費(fèi)體驗(yàn)。

據(jù)介紹，通義萬(wàn)相首批上線文生視頻、圖生視頻功能，在文生視頻功能中，用戶輸入任意文字提示詞，即可生成一段高清視頻，支持中英文多語(yǔ)言輸入，并可以通過(guò)靈感擴(kuò)寫功能智能豐富視頻內(nèi)容表現(xiàn)力，支持16:9、9:16等多種比例生成；在圖生視頻功能中，支持用戶將任意圖片轉(zhuǎn)化為動(dòng)態(tài)視頻，按照上傳的圖像比例或預(yù)設(shè)比例進(jìn)行生成，同時(shí)可以通過(guò)提示詞來(lái)控制視頻運(yùn)動(dòng)。

現(xiàn)場(chǎng)，阿里云演示了該模型強(qiáng)大的運(yùn)動(dòng)生成和概念組合能力，輸入「穿著滑冰鞋的小兔子在冰面上靈活移動(dòng)的可愛場(chǎng)景」，通義萬(wàn)相僅用數(shù)分鐘就能生成一段高清、逼真的視頻。

通義萬(wàn)相視頻生成大模型集成了多項(xiàng)創(chuàng)新技術(shù)，有效解決畫面表現(xiàn)力和大幅度運(yùn)動(dòng)等視頻生成技術(shù)難題。針對(duì)運(yùn)動(dòng)生成和物理模擬等難點(diǎn)優(yōu)化算法，實(shí)現(xiàn)了大幅度主體運(yùn)動(dòng)和運(yùn)鏡控制，并有效模擬真實(shí)世界物理特性；設(shè)計(jì)了高壓縮比、高質(zhì)量視頻VAE框架，有效降低視頻信息冗余，并保持高質(zhì)量視頻重構(gòu)能力；同時(shí)，基于輕量微調(diào)框架和精選數(shù)據(jù)集優(yōu)化訓(xùn)練，在中式傳統(tǒng)元素、風(fēng)格化視頻生成上表現(xiàn)更好。

去年7月，通義萬(wàn)相圖像生成大模型首次亮相，目前已累計(jì)生成7500萬(wàn)張圖片。云棲大會(huì)現(xiàn)場(chǎng)，通義萬(wàn)相宣布視覺生成大模型全面升級(jí)為Diffusion Transformer框架，同時(shí)結(jié)合通義千問(wèn)復(fù)雜提示詞解釋能力，有效提升畫面表現(xiàn)力、語(yǔ)義理解能力、可控生成能力。隨著通義萬(wàn)相視頻生成模型的發(fā)布，通義大模型已覆蓋文本生成、圖像理解、視頻理解、音頻理解、圖像生成、視頻生成等全模態(tài)場(chǎng)景。

04 通義靈碼AI編程能力再進(jìn)化，說(shuō)幾句話就能開發(fā)網(wǎng)頁(yè)

隨著通義大模型能力的全面提升，阿里云通義靈碼迎來(lái)重磅升級(jí)，從一年前只能完成基礎(chǔ)的輔助編程任務(wù)，進(jìn)化到幾句話就能完成需求理解、任務(wù)拆解、代碼編寫、修改BUG、測(cè)試等開發(fā)任務(wù)，最快幾分鐘可從0到1完成應(yīng)用開發(fā)，提升數(shù)十倍開發(fā)效率。

自去年首次亮相以來(lái)，通義靈碼已入職中華財(cái)險(xiǎn)、哈啰集團(tuán)、長(zhǎng)安汽車等公司，累計(jì)生成代碼超10億行,是國(guó)內(nèi)最受歡迎的輔助編程工具。全新升級(jí)的通義靈碼模擬了人類程序員的能力，可完成更復(fù)雜、更全面的任務(wù)；通義靈碼還可以脫離專業(yè)IDE軟件，在web端直接執(zhí)行缺陷修改、需求分析、代碼實(shí)現(xiàn)、問(wèn)題排查等任務(wù)工作流，兼具架構(gòu)師、開發(fā)工程師、測(cè)試工程師等多種崗位技能，大幅縮短了應(yīng)用的開發(fā)周期。

例如，真人程序員手動(dòng)開發(fā)一個(gè)網(wǎng)頁(yè)，通常需要1天的時(shí)間完成需求分解、寫代碼、測(cè)試等任務(wù)；現(xiàn)在，人類只需要輸入需求，通義靈碼5分鐘就能完成整個(gè)過(guò)程。阿里云表示，未來(lái)只要有創(chuàng)意，不懂代碼也能開發(fā)應(yīng)用和軟件。

云棲大會(huì)現(xiàn)場(chǎng)，一位13歲的中學(xué)生在通義靈碼上輸入幾句話，2分鐘就生成了一個(gè)python語(yǔ)言編寫的倒計(jì)時(shí)網(wǎng)頁(yè)；現(xiàn)場(chǎng)還有參會(huì)者，用通義靈碼修改開源魂斗羅游戲代碼，在9個(gè)代碼文件2000多行代碼里，幾分鐘就精準(zhǔn)修改了游戲角色的生命值、跳躍高度等參數(shù)。

目前，通義靈碼已廣泛應(yīng)用于金融、制造、互聯(lián)網(wǎng)、交通、汽車、能源等行業(yè)。在 Gartner 首個(gè)AI代碼助手魔力象限報(bào)告中，阿里云成為唯一進(jìn)入挑戰(zhàn)者象限的中國(guó)科技公司。

百模大戰(zhàn)一年后，應(yīng)用成為了大模型產(chǎn)業(yè)的主旋律。作為最早提出模型即服務(wù)（MaaS）理念的企業(yè)，阿里云一直把大模型生態(tài)的繁榮作為首要目標(biāo)。目前，魔搭社區(qū)已成為中國(guó)最大的模型社區(qū)，擁有超690萬(wàn)開發(fā)者用戶，與行業(yè)合作伙伴合作貢獻(xiàn)了超10000款模型。

“我們希望企業(yè)和開發(fā)者能以最低的成本做AI、用AI，讓所有人都能用上最先進(jìn)的大模型。”周靖人說(shuō)。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.