就在最近,豆包上新了圖像創(chuàng)作模型 Doubao-Seedream-4.5(以下簡(jiǎn)稱 Seedream 4.5)。
猜猜下面兩張圖片,哪張是 Seedream 4.5 生成的?哪張是最近風(fēng)頭正盛的 Nano Banana Pro 生成的?
![]()
![]()
答案是:上邊是 Seedream 4.5 生成的。你猜對(duì)了嗎?
為了進(jìn)一步測(cè)試它的底子,我們接著和 Nano Banana Pro 搞了幾場(chǎng)「PK」。
同樣的提示詞:
一位時(shí)尚的年輕亞裔女性在準(zhǔn)備外出赴約時(shí),用閃光燈拍攝了一張極具魅力的鏡前自拍照。
![]()
![]()
上邊是 Seedream 4.5,下邊是 Nano Banana Pro。
Seedream 4.5 精準(zhǔn)捕捉到了亞裔女性的特征,甚至在沒有限制尺寸的情況下,自動(dòng)生成了更符合自拍邏輯的豎畫幅。第一眼看到這張圖,我以為是哪位顏值博主在某書發(fā)的自拍。
相比之下, Nano Banana Pro 顯得沒有那么了解當(dāng)下亞洲女孩的審美。
接下來看看一致性,我將剛剛 Seedream 4.5 生成的亞裔女孩喂給了它們倆,讓它們生成一組《時(shí)尚芭莎》風(fēng)格的照片。
![]()
![]()
幾個(gè)問題:能看出是剛才的女孩去拍大片了嗎?你發(fā)現(xiàn)上圖是 Seedream 4.5 生成的了嗎?你是如何分辨出來的?
話不多說,接下來帶大家深扒一下,這個(gè)新模型大家都在怎么玩。
姐妹,神圖有了
找人幫忙拍照雖然「解放雙手」,但成片質(zhì)量全看天意。 數(shù)次被拍成「大猩猩」后,我的結(jié)論是:抱著「必出神圖」決心的,只有我自己。(愛你,老己 )
但這次……Seedream 4.5 好像真的值得「托付」。
還是剛才的亞裔女孩,使用 Seedream 4.5 達(dá)成了夸張的廣角畸變,讓前景的手部看起來巨大,但手指的關(guān)節(jié)結(jié)構(gòu)、臉部的神態(tài)依然保持得非常清晰銳利,完全沒有崩壞。那種電影海報(bào)般的「故事感」撲面而來。
![]()
提示詞:一張16:9的圖片,描繪了一個(gè)充滿張力的戰(zhàn)斗場(chǎng)景。畫面采用超廣角鏡頭和戲劇性的荷蘭式傾斜構(gòu)圖(Dutch angle)。主體姿態(tài)大膽動(dòng)感,身體隨鏡頭傾斜帶有慣性。關(guān)鍵細(xì)節(jié): 她的右手在臉前比出「手槍」手勢(shì)(食指伸直,拇指豎起),目光銳利地跟隨指尖指向前方;左手置于右手下方略靠前,五指完全張開掌心向上。由于廣角鏡頭的極端透視畸變,前景的左手顯得非常巨大,極具視覺沖擊力。光影與畫質(zhì): 盡管透視夸張,但雙手和臉部細(xì)節(jié)必須清晰銳利,解剖結(jié)構(gòu)準(zhǔn)確,線條干凈。光線為柔和的室內(nèi)照明,背景是中性模糊的環(huán)境,突顯出動(dòng)作的緊張感。
不用反復(fù)擺姿勢(shì),AI 一次就能給你滿意的結(jié)果。我的新結(jié)論是:求人不如求己,求己不如求 Seedream 4.5。
AI 也懂你的搭配小巧思
以往 AI 很難處理好漢字,但這張圖里,無論是「美瘋了」還是「長(zhǎng)發(fā)配禮帽絕了啊啊啊」,中文字跡很自然,有點(diǎn)像是用記號(hào)筆直接在照片上涂鴉一樣。甚至能根據(jù)人物的穿搭自動(dòng)生成夸贊的文案。
![]()
提示詞:在現(xiàn)有的圖像基礎(chǔ)之上,直接覆蓋添加一層凌亂的的評(píng)論、極富表現(xiàn)力的涂鴉,以及充滿活力的編輯風(fēng)格筆記。整體效果必須看起來像是用記號(hào)筆直接在打印出來的照片上書寫的一樣。字跡需要表現(xiàn)出一種自發(fā)、未經(jīng)過濾、情感化、略顯混亂且非常私人的感覺。所有添加的文字必須滿足以下條件:語言必須全部為中文;看起來像是手繪的、不均勻的、隨意的,并且相互重疊;語氣必須是積極向上的。每一條手內(nèi)容都不是預(yù)設(shè)的,系統(tǒng)必須自動(dòng)分析所上傳圖像的視覺內(nèi)容,并根據(jù)可見的元素來贊美畫面中的人物。主要觀察人物服裝風(fēng)格、面部表情、情緒氛圍、身體姿勢(shì)、配飾細(xì)節(jié)或色彩搭配等。這些評(píng)論必須是針對(duì)照片中突出的視覺吸引力或令人欽佩之處進(jìn)行定制的獨(dú)特贊美,嚴(yán)禁使用重復(fù)或通用的客套話。在文字之外,還需要添加以下剪貼簿風(fēng)格的元素:指向值得注意的時(shí)尚細(xì)節(jié)的箭、在有趣的區(qū)域下方畫上強(qiáng)調(diào)的下劃線、圈出畫面中的特定元素、像編輯修改痕跡一樣被劃掉的筆記。
但是效果并不穩(wěn)定,需要耐心調(diào)試。
打破次元壁
直接上圖,帥到誰了我不說。
![]()
![]()
提示詞@TechieBySA:角色的分割肖像,左側(cè)為風(fēng)格化的二維卡通或漫畫風(fēng)格,右側(cè)為超寫實(shí)的電影肖像風(fēng)格。兩部分在中心完美對(duì)齊,中間以撕開的漫畫紙邊緣分隔,象征著從插畫到現(xiàn)實(shí)的過渡。卡通部分采用扁平化的簡(jiǎn)潔圖形,而寫實(shí)部分則展現(xiàn)出豐富的紋理細(xì)節(jié)。柔和的中性攝影棚背景,戲劇性的光線,平衡對(duì)稱的構(gòu)圖,1080x1080 正方形畫幅。
圖中同時(shí)呈現(xiàn)出了兩種畫風(fēng)。左邊是二維卡通漫畫風(fēng)格,右邊是超寫實(shí)風(fēng)格,中間用「撕開的漫畫紙邊緣」作為分割線,實(shí)現(xiàn)了無縫對(duì)齊,非常適合做個(gè)性頭像或概念海報(bào)。
說實(shí)話,能夠在一個(gè) Prompt 里同時(shí)調(diào)度兩種完全不同的渲染邏輯,且構(gòu)圖依然保持平衡對(duì)稱,非常考驗(yàn)也展示了模型的指令遵循能力。
大道具,小人物
巨物題材最怕「假」,但看下面兩張圖,Seedream 4.5 對(duì)物理重量的理解還是讓人驚喜的。
一個(gè)普通身材的角色與一個(gè)體積巨大的物體進(jìn)行互動(dòng),通過夸張的比例差制造視覺奇觀,但 AI 依然能處理好身體的受力姿態(tài),不會(huì)出現(xiàn)違和的「懸浮感」。
那還說啥了,提示詞也放后面了。
![]()
主體與視角: 一張圖片主體的全身超逼真攝影棚人像,采用低角度仰視視角。角色以充滿力量感的運(yùn)動(dòng)姿態(tài)被捕捉,正在與一個(gè)巨大的超大尺寸籃球進(jìn)行互動(dòng)。互動(dòng)描述: 表現(xiàn)為單手將其托舉在背部,畫面展現(xiàn)出肉眼可見的身體張力。物體細(xì)節(jié): 一個(gè)細(xì)節(jié)豐富的超大籃球,材質(zhì)為帶有顆粒感的橙色皮革配金色線條。它占據(jù)了畫面的角色身高的80%。背景: 無縫的淺灰色墻壁和搭配的地板。氛圍與風(fēng)格: 極簡(jiǎn)奢華運(yùn)動(dòng)風(fēng)。8K超精細(xì)渲染,構(gòu)圖精準(zhǔn),完美比例,自然的物理接觸,紋理清晰,反射準(zhǔn)確,色調(diào)平衡。
![]()
主體與視角:一張衣著專業(yè)、身上沾滿面粉塵埃的年輕女性甜點(diǎn)師的全身超逼真攝影棚人像,采用富有沖擊力的低角度仰視視角。角色以充滿爆發(fā)力的運(yùn)動(dòng)感雜志大片姿態(tài)被捕捉,正在與一個(gè)巨大的超大尺寸金屬線狀打蛋器進(jìn)行互動(dòng)。互動(dòng)描述: 表現(xiàn)為雙腳分開站穩(wěn),身體大幅度前傾,用全身的重量和核心力量壓住并試圖轉(zhuǎn)動(dòng)那個(gè)巨大的打蛋器,仿佛在攪拌一缸粘稠的原料,畫面展現(xiàn)出肉眼可見的手臂肌肉線條緊繃、自然的吃力感和瞬間凍結(jié)的動(dòng)態(tài)能量。角色和物體在畫面中完全可見,比例縮放得當(dāng),呈現(xiàn)出一種既超現(xiàn)實(shí)又具真實(shí)感的視覺平衡。物體細(xì)節(jié): 一個(gè)細(xì)節(jié)豐富的超大鋼絲打蛋器,材質(zhì)為高度拋光的食品級(jí)不銹鋼,金屬線圈上粘著少許逼真的、半透明的蛋白霜或面糊殘留物。它占據(jù)了畫面的角色身高的130%(巨大的頭部?jī)A斜著占據(jù)前景)。表面具有逼真的冷金屬光反射、鋼絲交織的復(fù)雜紋理細(xì)節(jié),以及角色雙手緊握手柄時(shí)指關(guān)節(jié)發(fā)白的精確物理接觸感。燈光與環(huán)境: 柔和的專業(yè)攝影棚布光,具有平衡的高光和漫射陰影,清晰的反射和柔和的光線衰減,以強(qiáng)調(diào)真實(shí)感。背景: 無縫的柔和奶油色墻壁和搭配的地板,極簡(jiǎn)、干凈、帶有微弱反光,與面粉和金屬的色調(diào)相得益彰,保持畫面干凈。氛圍與風(fēng)格: 充滿活力的烹飪動(dòng)作大片,強(qiáng)調(diào)材質(zhì)觸感與動(dòng)態(tài)張力。8K超精細(xì)超逼真攝影棚渲染,構(gòu)圖精準(zhǔn),完美比例,自然的物理接觸,紋理清晰,反射準(zhǔn)確,色調(diào)平衡。
這才是自帶 BGM
今年不想截圖官方平臺(tái)的年度聽歌報(bào)告?這里有一種既能展現(xiàn)喜愛歌手的美貌,又能秀一把自己聽歌品味的方式。
巨大的豎屏手機(jī)不僅沒有產(chǎn)生割裂感,反而通過對(duì)屏幕透明度的精細(xì)處理,讓界面的微光與人物身上的影棚柔光完美融合。
![]()
![]()
提示詞@TechieBySA:一幅歌手的逼真全身肖像,采用其標(biāo)志性風(fēng)格,旁邊是一部巨大的豎屏智能手機(jī),屏幕上顯示音樂播放器界面播放歌曲,并采用()強(qiáng)調(diào)色,透明度約為 80%,以營造高級(jí)美感。藝人身著標(biāo)志性的服裝,擺出自信而富有時(shí)尚感的姿勢(shì),完美詮釋了歌曲的情緒和能量。她的表情與她的形象相得益彰。純色背景,帶有柔和的燈光點(diǎn)綴? 采用柔和的影棚燈光,搭配()調(diào)彩色濾光片;35mm 或 50mm 鏡頭,f/2.2 光圈,ISO 100-160,快門速度 1/125 秒;清晰聚焦于主體和手機(jī)界面? 編輯風(fēng)格與高端音樂平臺(tái)推廣活動(dòng)保持一致。
總的來說,你不再需要精通復(fù)雜的修圖軟件或排版理論,只需要一個(gè)好的腦洞,就能讓 AI 像一個(gè)懂審美、懂排版的設(shè)計(jì)搭檔一樣,精準(zhǔn)還原你腦海中的畫面。
還沒試過的朋友,趕緊去豆包試試看!
歡迎加入 APPSO AI 社群,一起暢聊 AI 產(chǎn)品,獲取,解鎖更多 AI 新知
我們正在招募伙伴
簡(jiǎn)歷投遞郵箱hr@ifanr.com
?? 郵件標(biāo)題「姓名+崗位名稱」(請(qǐng)隨簡(jiǎn)歷附上項(xiàng)目/作品或相關(guān)鏈接)
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.