![]()
最近有一位做短劇內(nèi)容的客戶找到我,她在把古裝短劇劇本轉(zhuǎn)化成文生圖提示詞時(shí)遇到了一個(gè)很典型的問(wèn)題:同一個(gè)角色,前一張圖是黑發(fā)高髻,下一張變成了披肩散發(fā);剛剛還穿著月白長(zhǎng)裙,轉(zhuǎn)場(chǎng)就換了顏色。十幾張圖出來(lái),人物的臉、服裝、氣質(zhì)全都對(duì)不上,根本沒(méi)法用于連貫的分鏡制作。
她用的是通用寫法,直接把劇情描述粘貼進(jìn)去,讓工具自己理解畫面,結(jié)果每一張圖都像是不同演員在演同一個(gè)角色。
這個(gè)問(wèn)題的本質(zhì)不是工具不行,是提示詞的邏輯沒(méi)有打通。
文生圖和寫文案不一樣。文案可以靠上下文推斷語(yǔ)氣,圖像沒(méi)有上下文記憶——你每輸入一條提示詞,工具看到的都是一張白紙。所以如果你不在每一條提示詞里把人物的外貌信息寫清楚,工具只能靠隨機(jī)猜測(cè)來(lái)填充細(xì)節(jié),人物“變臉”就成了必然。
要解決這個(gè)問(wèn)題,需要在指令層面做一件事:在生成任何畫面之前,先強(qiáng)制建立一份固定的人物視覺(jué)檔案,然后要求每次人物出鏡時(shí)都必須完整復(fù)述檔案信息。這不是技巧,是底層邏輯。
我交付給她的指令,核心設(shè)計(jì)了兩層結(jié)構(gòu):
第一層:人物視覺(jué)檔案前置鎖定。
在指令的第一步,不是讓工具直接出圖,而是先通讀全文,把所有主要人物的固定視覺(jué)標(biāo)簽提取出來(lái),格式必須包含年齡、發(fā)型頭飾、服裝顏色材質(zhì)款式、面部特征,統(tǒng)一建檔。
這一步的目的是給整個(gè)創(chuàng)作過(guò)程設(shè)定一個(gè)“人物數(shù)據(jù)庫(kù)”。只要這個(gè)數(shù)據(jù)庫(kù)在,后續(xù)每一張圖的人物描述都有據(jù)可查,不會(huì)出現(xiàn)信息漏填或自由發(fā)揮的情況。
以客戶的古裝短劇為例,我?guī)退雅魃颥幎x為:18歲,清冷堅(jiān)韌,鵝蛋臉,東亞面孔,黑長(zhǎng)發(fā)高髻淡玉簪,淡雅長(zhǎng)裙。這條描述一旦鎖定,無(wú)論后續(xù)出現(xiàn)多少個(gè)場(chǎng)景,這個(gè)人物的視覺(jué)呈現(xiàn)就有了固定的坐標(biāo)。
第二層:強(qiáng)制嵌入機(jī)制——人物每次出鏡都必須復(fù)述完整描述。
這是整套指令里最關(guān)鍵的一條規(guī)則,也是大多數(shù)人寫提示詞時(shí)最容易忽略的地方。
很多人覺(jué)得,第一條提示詞里寫過(guò)人物描述了,后面就不用重復(fù)了。這個(gè)邏輯在寫文章時(shí)沒(méi)問(wèn)題,在文生圖里完全失效。每一條提示詞是獨(dú)立的,工具不會(huì)記住你之前說(shuō)過(guò)什么。
我的處理方式是在指令里寫死一條死命令:只要畫面中出現(xiàn)主要人物,必須在人物稱呼后的緊鄰位置,用括號(hào)完整插入第一步定義好的視覺(jué)描述,包括性別、年齡、服飾和妝容。哪怕上下兩句只隔了逗號(hào),也要重復(fù)。
這條規(guī)則執(zhí)行起來(lái)看上去有點(diǎn)繁瑣,但它直接解決了人物“變臉”的根本原因。
除此之外,我還在指令里對(duì)空鏡頭做了專項(xiàng)處理:如果畫面中沒(méi)有人物,開頭必須標(biāo)記“無(wú)人,空鏡頭”,再接具體描述。這個(gè)區(qū)分讓工具在處理純景物鏡頭時(shí)不會(huì)莫名其妙地往里塞人物,整體分鏡的節(jié)奏感會(huì)更穩(wěn)。
用了新指令之后,前后對(duì)比很明顯。舊方式出來(lái)的提示詞是這樣的:林蕭站在廳堂中央,看著對(duì)面的喬玉,白天,古風(fēng)背景。
工具收到這條描述,對(duì)林蕭的年齡、發(fā)型、服裝一無(wú)所知,全靠隨機(jī)生成,每次出圖都是不同的人。
新指令生成的提示詞是這樣的:林蕭(女,18歲,清冷堅(jiān)韌,鵝蛋臉,東亞面孔,黑長(zhǎng)發(fā)高髻淡玉簪,淡雅長(zhǎng)裙,表情冷靜)站在將軍府正廳中央,直視對(duì)面的年輕女性,白天,背景是雕花立柱和青磚地面,正面中景,光線從側(cè)面窗欞透入,柔和自然光。
同一個(gè)人物,前后出圖的發(fā)型、服裝、氣質(zhì)穩(wěn)定了很多,客戶拿去做分鏡連貫性明顯提升。
客戶反饋說(shuō),以前出十張圖大概能用三四張,現(xiàn)在用新指令基本能用七八張,廢圖率降了不少,返工時(shí)間縮短了很多。
小說(shuō)或劇本轉(zhuǎn)文生圖這個(gè)需求,現(xiàn)在越來(lái)越普遍,但大多數(shù)人卡在“提示詞寫完人物就變形”這一關(guān),繞不過(guò)去。
核心問(wèn)題只有一個(gè):有沒(méi)有在指令層面給人物建立固定的視覺(jué)檔案,并強(qiáng)制每次出鏡都復(fù)述。這個(gè)底層邏輯想清楚了,人物一致性的問(wèn)題基本可以解決大半。
如果你也在做短劇、漫畫或小說(shuō)的分鏡轉(zhuǎn)化,遇到了類似的卡點(diǎn),不妨重新審視一下你的指令有沒(méi)有做這兩層設(shè)計(jì)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.