這是蒼何的第 484 篇原創(chuàng)!
大家好,我是蒼何。
要說近兩天最火的是什么,那就是元寶派了,我的幾十個群,從早到晚在發(fā)紅包鏈接,導(dǎo)致我的未讀消息直接飆到了上萬條,好家伙。
昨天也分享了幾百個邀請碼,建了不少元寶派,我發(fā)現(xiàn)大家在派里,經(jīng)常會用元寶來生圖,動不動就是好幾個人同時@元寶,發(fā)現(xiàn)元寶生圖還挺快的。
![]()
而且效果也比之前好了不少,我估摸著是升級了混元模型的生圖能力了,不然扛不住元寶派友們的熱情,噼里啪啦兩下卡住,體驗就不好了。
稍微查了下,果然不出所料,「騰訊悄悄發(fā)布并開源了混元圖像 3.0-Instruct 模型」,現(xiàn)在元寶上生圖,用的就是這個最新的混元模型。
我看了官方說明,混元圖像 3.0-Instruct 模型有以下的能力提升:
支持圖片編輯和多圖融合能力,指令遵循效果穩(wěn)定,生成的圖片一致性高、真實感強、情緒表現(xiàn)力佳,生成速度獲得明顯提升.
為了驗證下真假,我也對該模型進行了一輪拷打測試,下面開整。
除了元寶里面,我發(fā)現(xiàn),在騰訊混元官網(wǎng)也已經(jīng)上線了這個新模型,我就先在官網(wǎng)開始吧。
![]()
既然是圖生圖模型,熟門熟路,那就直接開測吧。
提示詞:將這張張“白天拍攝的枯樹”轉(zhuǎn)變?yōu)椤耙雇戆l(fā)光的阿凡達風(fēng)格生命之樹”
![]()
很快就生成了一張效果不錯的「生命之樹」:
![]()
光影的烘托和表現(xiàn)力上還是非常到位的。
接下來繼續(xù)給提示詞:將奔跑的人轉(zhuǎn)變?yōu)橛闪魉M成的半透明人影
![]()
提示詞:轉(zhuǎn)換為吉普力風(fēng)格
![]()
基本上生成最快十幾秒就生成了,生成速度上和表現(xiàn)力確實提升很大。
不像pro,生成最少也得等個幾十秒,等待的過程非常痛苦。
再來了一個小馬連環(huán)畫,同樣也是很快就生成出來,一致性保持的不錯。
提示詞:以這個小馬為主角,創(chuàng)作一個具有9張圖片的繪本故事,適合三歲小朋友閱讀,需要有簡單的文字,方便家長給小朋友講故事
![]()
![]()
前幾天去橫道河子被美哭了,拍了一些照片,里面有路人,讓它幫我P掉并美化一下
![]()
提示詞:幫我把這張圖片中的人P掉,并讓整個圖片看起來像有陽光照射的感覺
![]()
去磚石海的時候想拍一個落日時分的圖片,趕時間沒拍到,于是讓它P一下:
提示詞:這張人躺在冰塊堆中的照片,幫我把這張圖轉(zhuǎn)化為遠景俯拍,在人物周圍散落著成片的冰塊,營造人躺在冰塊群的感覺,黃昏中藍調(diào)的磚石海的感覺
![]()
瞬間就有那種感覺了好吧。
![]()
接下來又測試了一下風(fēng)格變換能力
給它一個美女,讓它幫忙變換風(fēng)格
提示詞:請給這個女生畫上四種不同的妝容,并匹配相應(yīng)的穿搭風(fēng)格和環(huán)境
![]()
人物一致性保持的不錯。
![]()
再讓它針對一些服裝單品,給出三套穿搭,給老婆看了,直呼牛掰,再也不用發(fā)愁怎么搭配單品了。
提示詞:這件白色的毛衣,毛衣拉鏈拉下來一些可變成翻領(lǐng)毛衣,請幫我想三個穿搭方案,女生
![]()
![]()
再來個萌萌噠的小企鵝吧
提示詞:以這個萌萌的企鵝為原型,設(shè)計三個Q版的企鵝圖像,分別為毛線風(fēng)格、像素風(fēng)格、吉普力風(fēng)格
![]()
![]()
我喜歡鳴人,想試試圖片變手辦的感覺
提示詞:把鳴人的這張圖做成3D手辦
![]()
![]()
再來試試人物畫像變真人
提示詞:請把XXX的畫像變成立體的真人
![]()
![]()
![]()
![]()
讓他們來個合照吧
提示詞:讓圖1和圖2的人物自拍,風(fēng)格換成真人寫實風(fēng)格,背景換成在故宮大殿里面拍攝,有自拍的模糊感
![]()
![]()
![]()
再來試試多圖融合的能力
提示詞:給圖一小貓穿上圖二,圖三喜慶的衣服和圍巾,背景是中式的溫馨家庭客廳
![]()
![]()
![]()
![]()
一通測下來,還挺興奮的。
首先,在文字理解能力上面,有了很大的進步,我的提示詞很口語化也不專業(yè),基本上一次就能成功;
第二,在生成速度上,非常快速,簡單一點的,十幾秒甚至幾秒鐘就能生成出來,復(fù)雜一點的不到一分鐘也能出來;
第三,圖片可用性很高,不用重復(fù)抽卡;
最重要的是目前還免費免費,這就非常爽了。
騰訊這一波,也是攢足了勁兒,發(fā)了 10 個億的紅包,讓更多人進來元寶,生圖是最重要的場景。
對于 C 端用戶來說,最不能接受的就是等待,騰訊必須在生圖速度上下苦功夫,不然,辛辛苦苦拉的用戶,卻因為生圖慢,效果差,而不斷吐槽,就得不償失了。
至少目前,我在我的十幾個派群里,還沒看到有人吐槽生圖慢或者不好的。
大家也在探索更多的玩法了。
最后總結(jié)下,混元圖像 3.0-Instruct 模型在指令遵循,圖像一致性,生成速度上表現(xiàn)不錯。
好了,感謝你喜歡我的文章,我們下一期見。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.