![]()
AI大模型投毒技術(shù),我可太熟悉了,我的工作就是折騰大模型deepsearch。
簡(jiǎn)單了解一下豆包、千問(wèn)這些AI的技術(shù)原理,就能理解如何AI投毒、如何收拾投毒者。AI APP收到用戶提問(wèn)后,響應(yīng)過(guò)程分為三步:S1.把用戶問(wèn)題分解為幾個(gè)搜索關(guān)鍵詞,S2.去網(wǎng)絡(luò)搜索,S3.從搜索結(jié)果中提取問(wèn)題答案。
S1和S3都是大模型推理運(yùn)算,數(shù)據(jù)都在GPU里,很安全。S2可以做手腳。315晚會(huì)曝光的AI投毒正是發(fā)生在S2步,好聽(tīng)的名字叫GEO(Generative Engine Optimization, 生成式引擎優(yōu)化)。
![]()
GEO公司用AI生成一批文章,可能幾篇、十幾篇、幾十篇,然后發(fā)布到一堆僵尸自媒體賬號(hào)上。AI大模型搜索的時(shí)候,搜到這些虛假文章,然后當(dāng)成真實(shí)內(nèi)容一本正經(jīng)地告訴用戶。AI中毒了。
很明顯,整治AI投毒的技術(shù)方法有多個(gè):
一是,自媒體平臺(tái)提前識(shí)別AI生成的文章,打上標(biāo)記,讓大模型不采納這些文章的信息。國(guó)標(biāo)GB 45438-2025《網(wǎng)絡(luò)安全技術(shù) 人工智能生成合成內(nèi)容標(biāo)識(shí)方法》[1]已經(jīng)在2025年9月1日開(kāi)始實(shí)施。網(wǎng)信辦在2025年03月14日發(fā)布的《人工智能生成合成內(nèi)容標(biāo)識(shí)辦法》,也是2025年9月1日開(kāi)始實(shí)施。
按照這兩個(gè)文件的規(guī)定,社交平臺(tái)有責(zé)任識(shí)別AI生成的自媒體文章,并打上顯式標(biāo)識(shí)和隱式標(biāo)識(shí)。顯式標(biāo)識(shí)看得見(jiàn),例如圖片上的水印“AI生成”;隱式標(biāo)簽看不見(jiàn),例如文件的元數(shù)據(jù)、圖片的元數(shù)據(jù)。
二是,把投毒騙子控制的僵尸賬號(hào)都封掉,至少得限流,讓它0曝光。
三是,AI APP只搜索可靠的信源,例如媒體賬號(hào)、政府企業(yè)賬號(hào)、身份經(jīng)過(guò)認(rèn)證的大號(hào),例如雷軍的賬號(hào)、楊紫的賬號(hào),粉絲小于100萬(wàn)的小卡拉米賬號(hào)不收錄。我自己的工作中,deepsearch的信源只選藍(lán)V(媒體、政企機(jī)構(gòu))和金橙V(頭部大V),避免中毒。
技術(shù)上給AI排毒很簡(jiǎn)單,但實(shí)際上不容易。先是社交平臺(tái)沒(méi)動(dòng)力,GEO公司運(yùn)營(yíng)著大量的僵尸賬號(hào),而且發(fā)貼很多,舍得出錢買流量。如果把這些賬號(hào)封了,平臺(tái)財(cái)報(bào)上的日活、月活、營(yíng)收數(shù)據(jù)都不好看。
AI APP也沒(méi)動(dòng)力,大模型推理很費(fèi)錢,生成一張圖片要3毛錢,生成1秒視頻要一塊錢。每天上億人在免費(fèi)用,燒錢太快,必須得想辦法掙錢,否則沒(méi)法向投資人交待。
AI APP沒(méi)有能力殺掉所有虛假文章。搜索引擎的技術(shù)含量很高,不是一個(gè)初創(chuàng)團(tuán)隊(duì)能搞得定的。因此,AI APP會(huì)向某度等公司購(gòu)買數(shù)據(jù)。某度,大家都了解,掙錢不要命,夾雜虛假信息再正常不過(guò)了。
最后一個(gè)原因,也是315晚會(huì)上所有亂象的根本原因:消費(fèi)者沒(méi)有實(shí)力把壞蛋送進(jìn)去踩縫紉機(jī),沒(méi)有實(shí)力讓他們傾家蕩產(chǎn)。有毒的雞爪天天吃,有毒的文字看點(diǎn)咋了?!多大點(diǎn)事!
全文完,求關(guān)注,求轉(zhuǎn)評(píng)贊三連。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.