早上我給朋友發(fā)了一張圖片,他驚訝地問我,你去字節(jié)上班了?
這張圖片是這樣的。
![]()
怎么樣,是不是毫無違和感?
別驚訝,開個(gè)玩笑,上班是不可能上班了,但 AI 可以幫我搞一張大廠體驗(yàn)卡。
如果我告訴你,這張字節(jié)工牌是由下面兩張圖片生成的,我沒有用 PS 魔法,只是簡單給 AI 提了一個(gè)需求。
![]()
最近我每天使用 AI 產(chǎn)品的頻率高了很多,也把很多 AI 產(chǎn)品應(yīng)用到了工作和生活中,有時(shí)候也會拿來玩一玩。
如果你還只是關(guān)注 AI 但還沒有上手 AI,我的建議是,盡快動手。
前陣子在朋友介紹下體驗(yàn)了字節(jié)的即夢 AI 新版本,準(zhǔn)確說是他們的新模型 Seedream 4.0。
即夢 AI 4.0 的主要特性是支持多圖參考和組圖生成,跟之前我介紹的 Nano Banana 能力類似。
我總共試驗(yàn)了不同場景下的需求,怎么說呢,沒那么滿意,但也不至于很失望。
先說幾個(gè)成功的案例。
我的第一個(gè)需求是將下面兩張照片合并成一張,提示詞是「把圖片中拿鏟子的小孩和另外一張圖里的大人放在一起,兩人并排站著看遠(yuǎn)方的湖泊」。
![]()
選擇 Seedream 4.0 的模型,經(jīng)過即夢 AI 的造夢后生成了一組圖片,我從中選擇了一張效果比較好的。
![]()
相較于原圖來說,AI 生成的圖對我的原圖做了光影優(yōu)化,更加還原了我所穿衣服的顏色。
另外,合成后的圖片里,參照了小小唐所在圖中的湖水顏色,而且水中還有天上云朵的倒影,岸邊鹽湖的質(zhì)感也呈現(xiàn)了出來。
原圖所在的地點(diǎn)是青海茶卡鹽湖,看來 AI 識別出來了。
再看一張我覺得效果不錯(cuò)的。
![]()
這張是把小小唐所在原圖中對岸的小火車和人群元素加了進(jìn)來,并且讓他站在我原本站的臺階上,而我站在了臺階下。
再看一個(gè)我覺得也算成功的案例,原圖是下面這張。
![]()
我的需求是把圖中的黑車變成白車,然后加上車牌號,提示詞是「把圖中的車輛換成白色,加上綠色新能源車牌,車牌號是“湘AFV0304”」。
看下結(jié)果。
![]()
車漆是換成功了,但車頂好像還是黑色,而且車牌的中文字有點(diǎn)歪曲。
接下來我又給它上了點(diǎn)難度,在原來提示詞的基礎(chǔ)上增加一個(gè)黑白雙拼車身的需求。
![]()
這次車頂也被修改成白色了,而且雙拼車漆的效果看起來也不錯(cuò),車牌也正確。
好,接下來就看其他失敗的案例,先看下面兩張?jiān)瓐D。
![]()
我輸入的提示詞如下。
![]()
不知道是我提示詞的問題還是照片比例問題,生成結(jié)果中我的人物比例都是偏大的。
而且,我的面部全部都糊掉了,就像一個(gè)巨人一樣站在臺上。
![]()
不過整個(gè)人物倒是摳出來了,而且手部動作也到位。
后來又調(diào)整了一下提示詞重新生成了一組圖片,雖然在其中找到了一張人物比例正確的,但是臉部依舊是糊的。
有趣的是,這次的結(jié)果中把我的照片搞到后面屏幕的 PPT 里去了,關(guān)鍵是臉部竟然沒糊。
![]()
接著看,我在網(wǎng)上找了一套衣服的圖片,希望把這套衣服穿在左邊我的照片上。
![]()
我從生成結(jié)果里找了一張相對靠譜的,衣服是穿上去了,但臉又糊了,已經(jīng)不怎么像我了。
![]()
神奇的是,AI 竟然把我光腿的樣子想象了出來,還別說,腿型和我真像,連腿毛都有刻畫。
然后我又給即夢 4.0 提了個(gè)需求,讓它以我這張照片為主題,生成一個(gè)包含 4 個(gè)畫面的分鏡頭,并配上字幕。
![]()
提示詞我是這么寫的「以圖中人物為主題,生成一組工作場景分鏡,主題是一個(gè)字節(jié)跳動的產(chǎn)品經(jīng)理和程序員在針對一個(gè)需求的討論,場景設(shè)定在會議室,總共出 5 張圖片,每一張圖下方都要配上中文字幕」。
然后,我得到了這 5 張圖片。
![]()
![]()
![]()
![]()
![]()
5 組分鏡倒是生成了,但還是前面的問題,臉糊掉了,而且表情和五官非常怪異。
另外,第三個(gè)分鏡中我和程序員的衣服竟然對調(diào)了,果然是穿一條褲子的難兄難弟。
除此之外,場景和情節(jié)構(gòu)建倒是挺像那么回事兒。
不管怎么說,AI 算是把我在字節(jié)的「工作照」給弄了出來。
既然即夢 4.0具備一定的推理能力,于是我讓它針對一個(gè)產(chǎn)品線框圖做高保真原型。
這是線框圖原圖。
![]()
提示詞是這樣的「把這張產(chǎn)品線框圖渲染成高保真原型,風(fēng)格選擇京東紅,保證設(shè)計(jì)規(guī)范的一致性,要求視覺美觀,文案正確」。
看結(jié)果。
![]()
從生成的結(jié)果來看,不能說一點(diǎn)不對,但也基本是沒啥用。
當(dāng)然,可能這個(gè)問題可能有點(diǎn)超綱了。
到目前為止我嘗試過的場景需求中,能稱得上結(jié)果令人基本滿意的只有前面兩個(gè),成功率并不高。
至于字節(jié)有沒有搞砸,我覺得還需要留一些時(shí)間給他們進(jìn)化。
可能是我的使用方式不對,也可能是提示詞不精準(zhǔn)或者題目太難,總之沒達(dá)到預(yù)期。
當(dāng)然,如果只是玩一玩基本也夠了,但如果要放在生產(chǎn)領(lǐng)域那就還差點(diǎn)火候。
不過我還是看到了一些實(shí)際應(yīng)用空間,
比如,假設(shè)在裝修設(shè)計(jì)環(huán)節(jié)我想對這個(gè)原圖的布局做一些調(diào)整,提示詞是「把這張圖片中客廳里的電視換成投影儀屏幕,地毯換成淺藍(lán)色,客廳頂部的燈換成吊頂圓燈」。
![]()
過去,可能需要設(shè)計(jì)師重新調(diào)整并再出一版方案。
現(xiàn)在,用 AI 進(jìn)行快速重構(gòu)并給客戶進(jìn)行演示的話,效率還是提高很多。
![]()
在上面的 AI 出圖中,除了投影儀的位置有問題,其他部分的改動需求 AI 都完整做到了。
除此之外,像廣告創(chuàng)意、產(chǎn)品演示、服飾搭配、裝修效果展示等場景都可以用到。
即夢 AI 4.0 倒是讓我看到了未來的一種創(chuàng)意方式,那就是把想象力變成現(xiàn)實(shí)的工具。
只要你有想法,你要你能準(zhǔn)確描述,剩下的就可以交給 AI。
因此,豐富的想象力和精準(zhǔn)的表達(dá)力,這依舊是我們作為人的優(yōu)勢,也是把 AI 當(dāng)做工具更好使用的杠桿。
類似即夢 AI 或者 Nano Banana 這樣的工具是普通人都可以上手的,如果你過去因?yàn)椴欢?PS 而難以下手,那現(xiàn)在只要你會說話就可以拿起 AI 的調(diào)色盤。
說到這我倒是覺得即夢的產(chǎn)品定義非常好,造夢。
電鋸在手,就不要惦記錘子了。
················· 唐韌出品 ·················
安可時(shí)刻
最近我繼續(xù)在小報(bào)童上更新 AI 基礎(chǔ)技術(shù)知識專欄,用通俗易懂的方式講解 AI 技術(shù)背后的原理,幫助不懂技術(shù)的同學(xué)了解基礎(chǔ)原理和邏輯。
目前 AI 章節(jié)已經(jīng)更新了十幾個(gè)知識點(diǎn),我爭取保持每周更新,其實(shí)也是對我學(xué)習(xí)和實(shí)踐的一次總結(jié)。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.