![]()
就算特意標(biāo)注 “右手拿蘋(píng)果、左手寫(xiě)字”,AI 也會(huì)倔強(qiáng)地顛倒過(guò)來(lái),甚至出現(xiàn)手指扭曲的 “鬼畜畫(huà)面”。這不是 AI 邏輯不行,是我們給它的 “童年教育” 出了問(wèn)題 , 訓(xùn)練數(shù)據(jù)集的偏見(jiàn),讓左手成了 AI 認(rèn)知里的 “盲區(qū)”。
![]()
不止是左手寫(xiě)字,只要涉及左右方位的精準(zhǔn)要求,AI 幾乎都會(huì) “掉鏈子”。
我嘗試讓模型畫(huà) “左手舉魔法棒”“左手拎雞右手拎高達(dá)”,結(jié)果要么左右顛倒,要么直接忽略左手的指令,全程用右手完成動(dòng)作。
![]()
測(cè)試中,有模型把左手畫(huà)成了右手的鏡像,還有的直接將剪刀放在右手上,完全無(wú)視 “左撇子” 的關(guān)鍵詞。
更有意思的是,當(dāng)要求生成 “雙手戴不同顏色手套” 時(shí),AI 能精準(zhǔn)畫(huà)出不同顏色,但依然會(huì)把原本指定給左手的顏色換到右手上。
這種穩(wěn)定的翻車(chē),不是模型算力不夠,而是它從訓(xùn)練數(shù)據(jù)里學(xué)到的 “常識(shí)” 就是:大部分動(dòng)作都該由右手完成。
![]()
研究指出,問(wèn)題的關(guān)鍵是數(shù)據(jù)集的 “完整度” 和 “平衡性” 不足。
完整度指的是每種場(chǎng)景的不同組合是否都有樣本,比如 “圓在上、三角在下” 和 “三角在上、圓在下” 都該出現(xiàn);平衡性則是指不同組合的樣本比例是否均勻。如果數(shù)據(jù)里 90% 都是 “右手寫(xiě)字”,AI 就會(huì)默認(rèn) “寫(xiě)字 = 右手”。
![]()
11 月 28 日《人民日?qǐng)?bào)》提到,某 AI 公司的數(shù)據(jù)集分析顯示,涉及手部動(dòng)作的樣本中,右手占比高達(dá) 89%,左手相關(guān)樣本僅占 7%,還有 4% 是雙手無(wú)明確左右區(qū)分的場(chǎng)景。
類似的偏見(jiàn)還出現(xiàn)在職業(yè)形象生成中,讓 AI 畫(huà) “工程師”“程序員”,男性形象占比超 80%,這也是因?yàn)橛?xùn)練數(shù)據(jù)里相關(guān)職業(yè)的男性樣本遠(yuǎn)多于女性,導(dǎo)致 AI 形成了刻板印象。
![]()
意識(shí)到問(wèn)題后,不少企業(yè)和科研機(jī)構(gòu)開(kāi)始著手優(yōu)化數(shù)據(jù)集。
團(tuán)隊(duì)負(fù)責(zé)人表示,新增樣本重點(diǎn)提升了數(shù)據(jù)的完整度和平衡性,比如右手寫(xiě)字和左手寫(xiě)字的樣本比例調(diào)整為 6:4,職業(yè)形象中女性、少數(shù)群體的占比也得到補(bǔ)充。
![]()
浙江大學(xué)人工智能研究所也在開(kāi)展相關(guān)研究,他們聯(lián)合美術(shù)院校學(xué)生,專門(mén)繪制了 10 萬(wàn)套 “左右方位精準(zhǔn)標(biāo)注” 的圖像素材,涵蓋日常動(dòng)作、職業(yè)場(chǎng)景等,目前已接入部分開(kāi)源模型進(jìn)行測(cè)試。
測(cè)試結(jié)果顯示,補(bǔ)充多元樣本后,AI 生成左手相關(guān)場(chǎng)景的正確率提升至 68%,雖然還沒(méi)達(dá)到完美,但已經(jīng)有了明顯改善。這說(shuō)明 AI 的偏見(jiàn)并非不可逆轉(zhuǎn),只要給它看到更完整的世界,它就能學(xué)會(huì)更全面的認(rèn)知。
![]()
AI 的偏見(jiàn),本質(zhì)上是人類認(rèn)知和數(shù)據(jù)采集的縮影。給 AI 補(bǔ)全多元樣本的過(guò)程,也是我們正視世界多樣性的過(guò)程。
隨著數(shù)據(jù)集不斷優(yōu)化,相信 AI 終將分清左右,而我們也該借此提醒自己:跳出固有認(rèn)知,才能看到更完整的世界。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.