![]()
這項由英屬哥倫比亞大學計算機科學系的郭文琦·馬歇爾、錢青云等研究團隊發表于2025年12月的最新研究,深入探討了當前AI圖像生成模型在美學對齊過程中存在的根本性問題。該研究發現,過度追求"普遍美感"的AI系統可能正在扼殺藝術創作的多樣性和用戶的真實意圖。有興趣深入了解的讀者可以通過arXiv:2512.11883查詢完整論文。
把AI圖像生成模型想象成一位總是想要討好所有人的畫家。當你請這位畫家為你創作一幅故意模糊、充滿噪點的實驗性藝術作品時,他卻總是忍不住要把畫面"修飾"得更加清晰美觀。這正是當前主流AI圖像生成系統面臨的核心問題:它們被訓練得過分追求一種所謂的"普遍美感",以至于無法忠實執行用戶的真實創作意圖。
研究團隊通過一個有趣的實驗驗證了這個現象。他們構建了一個包含300個"反美學"提示詞的數據集,專門測試AI模型是否能夠按照用戶要求生成故意"丑陋"或低質量的圖像。結果令人震驚:幾乎所有經過美學對齊訓練的模型都傾向于生成傳統意義上的"美圖",完全忽略了用戶明確表達的反美學需求。這就像一個總是想要把所有食物都做成甜品的廚師,即使顧客明確點了苦瓜,他也會不自覺地加糖調味。
這種現象背后隱藏著更深層的問題。當AI系統被訓練以迎合大眾審美偏好時,它們實際上在壓制藝術表達的多樣性。歷史上許多重要的藝術運動,如野獸主義、表現主義和達達主義,在當時都被認為是"丑陋"或"反美學"的。研究團隊特別提到了亨利·馬蒂斯1904年的作品《奢華、寧靜與享樂》,這幅開創野獸主義先河的畫作通過故意違反當時的美學規范而獲得了巨大的藝術價值,但在現代AI評判標準下卻獲得了極低的分數。
為了深入理解這個問題,研究團隊提出了一個五層分析框架,就像剝洋蔥一樣逐層揭示問題的本質。第一層探討的是開發者利益與用戶需求的沖突:AI公司為了規避法律風險和維護聲譽,往往會預設一套"安全"的審美標準,這種做法實質上是在用開發者的價值觀替代用戶的真實需求。這就像一個畫廊策展人為了迎合贊助商的喜好,拒絕展出任何可能引發爭議的藝術作品。
第二層關注的是固有偏見問題。即使開發者出于善意,他們對"美"的定義仍然會受到自身文化背景和價值觀的影響。研究顯示,AI模型往往偏向西方審美標準,在生成人物圖像時傾向于展現西方面孔特征。這種偏見不僅體現在人物形象上,還滲透到了對光線、色彩、構圖等基本視覺元素的判斷中。
第三層討論的是群體偏好與個體需求的沖突。即使存在一個真正的"大眾審美",這種標準化的偏好是否應該凌駕于個人的具體創作意圖之上?當用戶明確要求生成低質量或"丑陋"的圖像時,AI系統自動"美化"這些輸出實際上是在損害用戶的創作自主權。
第四層警告過度追求單一價值可能帶來的意外傷害。當AI系統過分強調某些特定的美學元素(如明亮度、積極情緒)時,可能會產生適得其反的效果。這就像一個總是試圖讓食物更甜的廚師,最終可能會做出甜得發膩、令人反胃的菜肴。
第五層揭示了"美化現實"的危險性。當AI生成的圖像總是完美、光鮮、理想化時,它們可能會偏離真實世界,創造出一個虛假的烏托邦式視覺環境。這種傾向可能會強化不健康的審美期待,就像社交媒體濾鏡文化一樣,讓人們對真實世界產生不切實際的期望。
一、AI模型的美學偏見實驗
研究團隊設計了一個巧妙的實驗來驗證他們的假設。他們首先從常用的COCO數據集中選擇了300個普通的圖像描述,然后使用先進的視覺語言模型Qwen3-VL對這些描述進行"反美學"改造。這個過程就像給一份正常的菜譜添加故意制造難吃效果的特殊說明。
改造后的提示詞會明確要求AI生成具有特定缺陷的圖像:模糊不清的細節、刺眼的色彩搭配、缺乏主體焦點的構圖、壓抑的情緒氛圍等。例如,原本簡單的"摩托車手在賽道上過彎"會被改寫成"模糊、碎片化、隨機構成的摩托車比賽圖像,缺乏清晰意圖,主要對象小而邊緣化,在混亂、未完成的視覺噪音中幾乎不可見"。
研究團隊測試了多個主流AI圖像生成模型家族:Flux系列(包括基礎版本和經過不同程度美學對齊的變體)、Stable Diffusion系列以及谷歌的Nano Banana模型。就像比較不同品牌的自動調色板,看它們在收到"請調出一種故意難看的顏色"指令時會如何反應。
實驗結果清晰地驗證了研究團隊的擔憂。經過美學對齊訓練的模型(如DanceFlux、Playground等)在面對反美學指令時表現最差,它們似乎無法抗拒生成"漂亮"圖像的沖動。相比之下,一些較少經過美學調優的模型(如原始的Flux Dev或Nano Banana)反而能夠更忠實地執行用戶的反美學要求。
二、獎勵模型的評判偏見
除了測試圖像生成能力,研究團隊還深入研究了AI系統用來評判圖像質量的"獎勵模型"。這些模型就像藝術比賽的評委,它們的評判標準直接影響著AI系統的"審美觀"。
研究團隊發現了一個令人擔憂的現象:即使用戶明確要求生成反美學圖像,這些獎勵模型仍然會給傳統意義上的"美圖"打高分,給忠實執行反美學指令的圖像打低分。這就像一個頑固的美食評委,即使比賽項目是"最佳苦味料理",他仍然會不自覺地給甜品更高的分數。
具體來說,研究團隊測試了包括HPSv3、ImageReward、PickScore等在內的多個主流獎勵模型。在分類準確性測試中,這些模型在識別哪張圖像更好地遵循了反美學指令方面的表現非常糟糕,有些甚至比隨機猜測還要差。HPSv3模型的準確率僅為38.1%,遠低于隨機水平的50%。
相比之下,一些基礎的視覺語言模型(如CLIP和BLIP)反而表現更好,能夠更準確地識別哪張圖像真正符合用戶的反美學要求。這個發現很有啟發性:問題不在于AI無法理解復雜的創作指令,而在于過度的"美學調優"破壞了模型的客觀判斷能力。
三、情緒偏見的深度測試
研究團隊還專門針對情緒表達進行了深度測試,因為他們注意到許多AI系統存在明顯的"有毒積極性"傾向——過度偏好積極情緒而壓制負面情緒的表達。這種傾向就像一個總是要求所有人都要微笑的攝影師,無法容忍任何憂郁或憤怒的表情。
在這個實驗中,研究團隊首先讓Nano Banana生成表達快樂情緒的人物圖像,然后使用圖像編輯功能將同樣的人物改造成表達悲傷、憤怒或恐懼情緒的版本。這種對比實驗設計巧妙地控制了除情緒之外的所有變量,就像制作了一組只有表情不同的證件照。
結果顯示,獎勵模型對負面情緒表現出了系統性的偏見。即使用戶明確要求生成表達悲傷或憤怒情緒的圖像,這些模型仍然會給表達快樂情緒的版本更高的分數。HPSv3在識別憤怒情緒方面的準確率僅為19%,在識別悲傷情緒方面也只有44%。
更令人擔憂的是,一些經過高度美學對齊的生成模型(如DanceFlux)在收到生成負面情緒的明確指令時,往往會"拒絕"執行,轉而生成中性甚至積極的表情。這種現象反映了AI系統中根深蒂固的情緒偏見,它們似乎被訓練得認為積極情緒就是"好的",負面情緒就是"壞的"。
四、真實藝術作品的評估實驗
為了進一步驗證他們的發現,研究團隊將這些獎勵模型應用到真實的藝術作品上,測試它們如何評判歷史上的重要藝術創作。他們從LAPIS數據集中選擇了約1萬件涵蓋不同風格和流派的真實藝術作品,就像讓現代的美食評委去品嘗歷史上各個時期的經典菜肴。
結果令人震驚:許多在藝術史上具有重要地位的作品在這些AI評判標準下得分極低,甚至低于早期AI生成系統(如SD1.4或DALL-E mini)的作品。研究團隊特別展示了幾個具體例子:雷諾阿的《花卉研究》得分8.44分,彼得·麥克斯的《四季:冬天》僅得2.43分,保羅·詹金斯的《持續黎明現象》得7.32分。這些分數都遠低于當代AI生成圖像的平均水平。
這個發現揭示了一個深層問題:當前的AI美學標準可能過于狹隘,無法欣賞藝術表達的多樣性和復雜性。這就像用現代快餐標準去評判傳統手工美食,結果必然會錯失許多珍貴的文化價值和藝術成就。
五、圖像編輯實驗的進一步驗證
為了確認問題出在模型的生成能力還是理解能力上,研究團隊設計了一個圖像到圖像的編輯實驗。他們首先選擇了Nano Banana成功生成的低質量反美學圖像作為起點,然后讓其他模型(Flux Krea和DanceFlux)基于相同的反美學指令對這些圖像進行進一步編輯。
這個實驗設計就像給不同的修圖師同一張故意拍糊的照片,并明確告訴他們"請保持這種模糊效果",看他們會如何處理。結果顯示,經過高度美學對齊的DanceFlux會自動"清理"圖像,即使同時收到了清晰的反美學起始圖像和反美學編輯指令這兩個強烈信號,它仍然傾向于生成更加符合傳統美學標準的輸出。
相比之下,美學對齊程度較低的Flux Krea能夠更好地保持原有的反美學特征。定量分析顯示,DanceFlux編輯后的圖像在HPSv3評分上比原圖高出3.13分,而Flux Krea只高出2.18分。這意味著DanceFlux進行了更大程度的"美化處理",偏離了用戶的原始意圖。
六、社會批評藝術的審查效應
研究團隊還發現了一個更加令人擔憂的現象,他們稱之為"圖像新語"(Image NewSpeak),這個名詞借用了喬治·奧威爾《1984》中的概念。他們發現,經過美學對齊的AI模型不僅會拒絕生成技術上的低質量圖像,還會系統性地"凈化"那些旨在進行社會批評或揭露現實陰暗面的藝術表達。
在一個具體實驗中,研究團隊要求不同模型生成反戰主題的圖像,通過展示戰爭恐怖來表達反戰立場。結果顯示,高度對齊的模型(如DanceFlux)傾向于生成"干凈"、甚至帶有溫暖感的圖像,完全失去了批判性藝術應有的沖擊力。而較少對齊的模型(如Nano Banana和Flux Krea)能夠更準確地傳達作品的批判意圖。
這種現象不僅僅是美學偏見,更可能構成一種無意識的意識形態審查。當AI系統系統性地美化或淡化社會問題的視覺表達時,它們實際上在限制藝術家通過作品進行社會批評和反思的能力。這就像一個總是要求把所有新聞都改寫得"積極正面"的編輯,最終可能會掩蓋重要的社會問題。
七、緩解方案的探索與局限
研究團隊也探索了一些可能的解決方案,主要集中在"負向引導"技術的應用上。這種方法就像在調色板中加入"反向顏料",通過明確告訴AI系統"不要做什么"來引導它生成期望的反美學效果。
他們測試了Value Sign Flip (VSF)和Negative Attention Guidance (NAG)等技術,發現這些方法確實能夠在一定程度上強制模型生成反美學圖像,有時甚至效果比Nano Banana還要好。然而,這些解決方案都需要復雜的參數調優和技巧性操作,就像需要精密計算才能讓一個總是想要清理東西的機器人故意制造混亂一樣。
更重要的是,這些技術方案的存在本身就證明了問題的結構性本質。如果AI系統天然就能理解和執行用戶的反美學意圖,我們根本不需要這些復雜的"逆向工程"技術。這些緩解方案的脆弱性和復雜性恰恰支持了研究團隊的核心論點:當前的美學對齊范式存在根本性問題,需要全新的對齊策略。
八、對未來AI發展的深遠影響
這項研究揭示的問題遠不止技術層面的缺陷,它觸及了AI系統設計中的根本性價值觀問題。當我們讓AI系統按照所謂的"普遍人類偏好"進行對齊時,我們實際上是在讓機器替人類做價值判斷,而這些判斷往往反映的是開發者群體的有限視角,而非真正的人類多樣性。
從更廣闊的角度來看,這種過度對齊可能會導致文化同質化和創意表達的貧乏。如果未來大量的視覺內容都由遵循相同美學標準的AI系統生成,我們可能會失去藝術表達的豐富性和多樣性。這就像如果所有的音樂都由只懂得一種音樂風格的作曲家創作,整個音樂世界將變得多么單調乏味。
研究還指出了AI系統中存在的"開發者中心主義"問題。當AI公司為了規避風險和維護形象而預設某些價值標準時,他們實際上是在行使一種隱形的文化權力,影響著用戶能夠表達和創造的內容類型。這種權力關系可能會削弱用戶的創作自主權,限制藝術和文化的自然發展。
此外,研究團隊強調的"有毒積極性"問題也值得深思。在現實生活中,負面情緒和"不美"的事物往往承載著重要的信息和價值。憤怒可能是對不公正的合理反應,悲傷可能是對失去的健康表達,而"丑陋"的藝術可能是對社會問題的深刻反思。當AI系統系統性地壓制這些表達時,它們可能在無意中推動一種虛假的和諧,掩蓋真實世界的復雜性。
說到底,這項研究提醒我們,AI對齊不應該是簡單地讓機器迎合某種預設的"正確"標準,而應該是幫助機器更好地理解和服務于人類的真實需求和多樣化意圖。真正成功的AI系統應該能夠像一個善解人意的合作伙伴,既能在用戶需要時提供美觀的輸出,也能在用戶有其他創作目標時忠實地執行這些意圖。
歸根結底,藝術和創意表達的價值往往就在于它們能夠突破常規、挑戰既定標準、表達復雜情感。如果我們的AI工具無法支持這種創作自由,那么它們可能會成為創意表達的障礙而非助力。這個問題不僅關乎技術發展的方向,更關乎我們希望在AI時代保持什么樣的人類價值和文化多樣性。
這項研究為未來的AI開發提供了重要啟示:我們需要設計能夠理解和尊重用戶意圖多樣性的AI系統,而不是簡單地追求某種狹隘定義的"完美"。只有這樣,AI才能真正成為人類創意表達的有力工具,而不是束縛創作自由的隱形枷鎖。
Q&A
Q1:什么是"寬譜美學"或"反美學"圖像?
A:寬譜美學是指用戶故意要求生成具有低質量屬性的圖像,比如模糊、噪點、失真效果,或者不符合傳統審美的視覺元素。這不是技術錯誤,而是為了實驗性藝術創作、社會批評或特定技術用途而故意設計的視覺效果。就像藝術家有時會故意使用"丑陋"的色彩搭配來表達特定情感或觀點。
Q2:為什么AI圖像生成模型無法按用戶要求生成"丑陋"圖像?
A:主要原因是這些模型經過了過度的"美學對齊"訓練,被教導要生成符合大眾審美偏好的"漂亮"圖像。即使用戶明確要求生成低質量或反美學圖像,模型仍然會不自覺地進行"美化處理"。這就像一個總想討好所有人的畫家,無法抗拒把畫面修飾得更美觀的沖動,即使這違背了用戶的真實意圖。
Q3:這種美學偏見會對藝術創作產生什么影響?
A:這種偏見可能會嚴重限制藝術表達的多樣性和創作自由。許多重要的藝術運動(如野獸主義、達達主義)在歷史上都曾被認為是"反美學"的,但它們對藝術發展具有重要價值。如果AI系統無法支持這類創作,可能會導致文化同質化,壓制社會批評藝術,并推動一種虛假的"完美主義"審美標準。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.