2月10日,阿里巴巴正式發(fā)布新一代圖像生成及編輯模型Qwen-Image-2.0。作為千問大模型的圖像生成模型底座,Qwen-Image-2.0集生圖和編輯于一體,在AI Arena文生圖評測中斬獲1029分,超過Seedream4.5、Flux2-Max等模型,僅次于谷歌Nano Banana Pro和GPT Image1.5。Qwen-Image-2.0支持1K token的超長文字輸入和2K高分辨率,可準(zhǔn)確渲染復(fù)雜指令,輕松生成專業(yè)的PPT及信息圖,質(zhì)感媲美專業(yè)級攝影師;同時(shí),千問新模型擁有極強(qiáng)中文漢字渲染能力,數(shù)百字的古文全文幾乎都能完全渲染在圖片中。
![]()
AI Arena文生圖評測中,Qwen-Image-2.0位居第三
Qwen-Image-2.0在Qwen-Image和Qwen-Image-Edit兩大模型基礎(chǔ)上全新升級,首次將圖像生成和編輯統(tǒng)一到一個(gè)模型中去,以更輕量的模型架構(gòu),實(shí)現(xiàn)了生圖和改圖性能的大幅提升。Qwen-Image-2.0生圖質(zhì)感尤為細(xì)膩,小至老人皺紋的褶皺,大到浩然宇宙,模型生成的人物、自然、建筑等常用圖片都極其逼真。在權(quán)威評測AI Arena中,千問新模型在圖像生成中得分1029,位列第三;在圖片編輯中得分1034,僅次于Nano Banana Pro。
![]()
Qwen-Image-2.0生圖,以瘦金體寫詩配圖
在中文漢字渲染方面,Qwen-Image-2.0表現(xiàn)極為突出,不但可以以多種字體準(zhǔn)確渲染漢字,而且寫得又多又準(zhǔn),效果比 Nano Banana Pro更優(yōu)。千問新模型將輸入提示詞擴(kuò)展到1K token,可詳盡描述任務(wù),實(shí)現(xiàn)更專業(yè)的文字渲染,輕松拿捏專業(yè)PPT、高級海報(bào)、多格漫畫等復(fù)雜圖片,比如以小楷字體幾近完全渲染《蘭亭集序》數(shù)百字的全文配圖,以自然語言生成論文格式配圖的復(fù)雜PPT等。
![]()
Qwen-Image-2.0生圖,實(shí)現(xiàn)多文字復(fù)雜PPT一鍵生成
基于Qwen-Image-2.0模型,用戶可與AI協(xié)同創(chuàng)作出更豐富、更實(shí)用的圖片,比如一句話生成宮保雞丁的做法流程圖,杭州兩日旅游攻略圖,4x6的多格漫畫組圖,兒童繪本圖,寫實(shí)風(fēng)格的電影海報(bào),極為逼真的綠色叢林等等;同時(shí),用戶也可上傳數(shù)張圖片進(jìn)行編輯,生成諸如九宮格多手勢自拍,真人配字表情包,雙人逼真AI合影,詩詞配圖等。
![]()
Qwen-Image-2.0編輯圖片,人物姿勢自然,質(zhì)感真實(shí)
據(jù)了解,阿里云百煉上已開通API邀測,開發(fā)者也可通過Qwen Chat免費(fèi)體驗(yàn)新模型。
(完)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.