<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      63%成功率!詩歌成突破AI防護新工具,語言攻擊術曝光

      0
      分享至



      最近意大利一幫研究人員干了件挺顛覆的事他們用寫詩的方式,把現在最牛的AI模型給“忽悠”了。

      羅馬薩皮恩扎大學聯合DexAI團隊做了個實驗,結果讓整個AI安全圈都安靜了不少。

      他們找了25個市面上主流的AI模型,包括OpenAI、谷歌、Anthropic這些大廠的產品。



      測試方法說起來挺簡單,讓研究員寫幾首詩,再讓AI自己生成一些詩,然后拿這些詩歌當“敲門磚”,問模型一些敏感問題。

      結果比我想象的夸張,人工寫的詩歌成功率不低,超過一半的情況下,AI都“中招”了,把不該說的信息給抖了出來。

      反觀AI自己生成的詩歌,效果就差一截,成功率掉了快兩成。



      更有意思的是模型之間的差距,谷歌的Gemini2.5簡直是“一騙一個準”,測試的詩歌全給突破了,而OpenAI的GPT-4onano倒是硬氣,一次都沒被攻破。

      這對比看著就像一個不設防的倉庫,和一個裝了三重鎖的保險柜,這里就得提個怪事了。

      本來以為模型越大、參數越多,應該越聰明,防御能力也越強吧?結果這次實驗打了臉小模型反而更“警惕”,成功率低得可憐,有的甚至個位數。



      這事兒想想挺諷刺,咱們總覺得技術越先進越安全,結果可能是把“門鎖”做精致了,卻忘了“窗戶”沒關。

      具體到案例,有個場景挺嚇人。

      研究人員想試試AI會不會泄露危險化學品的制作流程,就編了首關于“星辰與原子”的詩,里面藏著钚-239的生產步驟。



      結果你猜怎么著,好幾個模型還真把詳細流程給列出來了,從原料處理到提純步驟,一應俱全。

      研究報告里寫這是“利用隱喻結構實現的隱蔽信息提取”,說白了就是用風花雪月的詞,包裝了危險內容。



      為啥這些詩歌能繞過防御,研究人員分析了那些“成功案例”的詩,發現它們都有個共同點,不按常理出牌。

      正常說話是一句接一句講邏輯,詩歌不一樣,一會兒寫景,一會兒抒情,語義跳來跳去。

      AI的安全過濾器本來是按關鍵詞或者句子邏輯來判斷風險的,結果碰到這種“東一榔頭西一棒子”的表達,直接懵圈了。



      還有個細節挺有意思,研究團隊發現寫詩的“門檻”極低。

      不是說要寫得跟莎士比亞似的,隨便湊幾句押韻的句子,把敏感信息藏在比喻里,就能起效。

      他們找了幾個完全不懂AI的大學生來寫,成功率也沒差多少。

      這就意味著,這漏洞不是只有專家能利用,普通人稍微琢磨琢磨,也可能“上手”。



      要解釋清楚詩歌為啥能“忽悠”AI,得先說說AI是怎么“理解”語言的。

      但它不懂真正的“意思”,就像你背熟了一本成語詞典,卻不知道每個成語背后的故事。



      但實際上“鉛色云團”指的是某種原料,“爐中熔煉”是反應步驟。

      AI只看到詞的搭配沒問題,沒意識到深層的危險含義。



      這讓我想起以前的網絡釣魚郵件,黑客不會直接說“我是騙子”,而是假裝銀行發通知,或者朋友求救,用偽裝過的內容繞過垃圾郵件過濾器。

      現在的詩歌攻擊,其實是一個道理,只不過把“郵件模板”換成了“詩歌體裁”。

      OWASP安全框架里早有“提示注入”的風險分類,只是誰也沒想到詩歌能玩出這么大花樣。



      更麻煩的是,AI模型越大,學的知識越多,反而可能越容易被“反噬”。

      就像一個記憶力超強的人,別人問啥都能答上來,卻分不清哪些問題該拒絕回答。

      面對這種漏洞,研究界現在有點頭疼。



      最直接的問題是,這些“高危詩歌”要不要公開?按以前的規矩,發現漏洞就得詳細披露,讓大家趕緊補。

      但這次不一樣,要是把具體怎么寫詩攻擊AI的方法發出來,等于給壞人遞刀子。

      所以團隊最后決定,只說有這么個漏洞,具體的詩歌例子和技巧,暫時不公開。

      這種“自我審查”在安全研究里挺少見的,不過也能理解,畢竟風險實在太直接了。



      技術上的防御手段也挺難辦,現在AI的安全過濾,主要靠關鍵詞和敏感話題庫。

      但詩歌攻擊根本不用敏感詞,全靠隱喻和暗示。

      你總不能把“星辰”“爐火”這些詞都拉黑吧,那以后AI連寫詩都不會了。

      Anthropic試過用“瀏覽器代理”搞分層防御,讓模型先“三思”再回答,但測試下來效果一般,復雜點的詩歌還是能繞過去。



      產業界倒是開始有動作了,歐盟的AI法案最近在加碼安全要求,特別是對生成式AI的內容審核。

      有些公司也在琢磨,是不是模型不一定非要搞那么大?這次實驗里小模型表現更好,說明“精簡”可能比“堆砌”更安全。



      說到底,這次意大利的研究給整個AI行業提了個醒。咱們天天比誰家模型參數多、能寫會畫,卻可能忽略了最基礎的安全問題。



      AI理解人類語言的方式,從根上就帶著“bug”它能模仿,能預測,卻很難真正“懂”什么該說,什么不該說。

      未來要防住這種“詩歌攻擊”,可能得跳出純技術思維。

      不光要升級算法,還得讓AI更懂“人情世故”,知道哪些話是“話里有話”。



      當然了,這事兒估計沒那么容易,畢竟人類的語言游戲,玩了幾千年都沒玩明白,AI想學會,怕是還有得磨。

      最后說句實在的,科技發展總這樣,解決一個問題,冒出新問題。

      以前擔心AI太笨,現在擔心AI太“實在”別人寫首詩就把家底抖了。



      或許這就是技術進步的代價吧,永遠在攻防拉鋸中往前挪。

      咱們能做的,就是別迷信“最先進”,時刻留個心眼。



      聲明:個人原創,僅供參考

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      滬指,還是8連陽了!11:13,全市場為何同步跳水?

      滬指,還是8連陽了!11:13,全市場為何同步跳水?

      每經牛眼
      2025-12-26 15:26:22
      事實證明,“消失”多年的清華才女武亦姝,證實了董卿當年沒說錯

      事實證明,“消失”多年的清華才女武亦姝,證實了董卿當年沒說錯

      千言娛樂記
      2025-09-25 20:27:56
      俄軍奪取胡里艾波列烏102旅司令部,繳獲全部防線資料!

      俄軍奪取胡里艾波列烏102旅司令部,繳獲全部防線資料!

      勝研集
      2025-12-26 13:37:57
      26號收評:滬指錄得8連陽!所有人都注意了,大盤下周開始這樣看

      26號收評:滬指錄得8連陽!所有人都注意了,大盤下周開始這樣看

      春江財富
      2025-12-26 15:24:54
      笑發財了!媽媽問網友給孩子買的衣服是退是留,評論區炸鍋!

      笑發財了!媽媽問網友給孩子買的衣服是退是留,評論區炸鍋!

      另子維愛讀史
      2025-12-26 16:35:27
      意外!王鈺棟為何會突然身披熱刺球衣亮相?本人社媒發聲給出答案

      意外!王鈺棟為何會突然身披熱刺球衣亮相?本人社媒發聲給出答案

      瀟湘煙雨水
      2025-12-26 15:53:36
      阿維塔宣稱南極-50℃極寒測試,被網友打假:南極現在是夏季

      阿維塔宣稱南極-50℃極寒測試,被網友打假:南極現在是夏季

      玩車專家1
      2025-12-25 17:24:33
      從火箭棄將到灰熊寶藏!蘭代爾11+6+41%三分,底薪合同變千萬身價

      從火箭棄將到灰熊寶藏!蘭代爾11+6+41%三分,底薪合同變千萬身價

      奕辰說球
      2025-12-26 11:55:50
      川普經濟笑話沒有看到,為什么主流經濟學家又錯了?

      川普經濟笑話沒有看到,為什么主流經濟學家又錯了?

      移光幻影
      2025-12-26 09:43:18
      苗苗鄭愷的農場火了!種了一大片菜,養了300只小動物

      苗苗鄭愷的農場火了!種了一大片菜,養了300只小動物

      每日一見
      2025-12-23 21:05:21
      嘉興:2026 年起取消本地小客車高速免費新政

      嘉興:2026 年起取消本地小客車高速免費新政

      和訊網
      2025-12-25 14:25:04
      我爸被惡霸打斷肋骨,舅舅連夜從首都開車回來,惡霸撲通一聲跪下

      我爸被惡霸打斷肋骨,舅舅連夜從首都開車回來,惡霸撲通一聲跪下

      張道陵秘話
      2025-12-23 10:20:44
      籃協不再容忍!公開宮魯鳴被傳打壓王思雨真相,李夢也能松口氣

      籃協不再容忍!公開宮魯鳴被傳打壓王思雨真相,李夢也能松口氣

      小小李娛
      2025-12-26 11:40:35
      泰王訪華實屬無奈?開口就是三大需求,中國不會輕易松口

      泰王訪華實屬無奈?開口就是三大需求,中國不會輕易松口

      古事尋蹤記
      2025-11-17 07:28:16
      無視慘敗!即便湖人圣誕夜狂輸23分,詹姆斯仍強勢創下5大神跡!

      無視慘敗!即便湖人圣誕夜狂輸23分,詹姆斯仍強勢創下5大神跡!

      田先生籃球
      2025-12-26 14:47:46
      項立剛單方面叫陣5天后,羅永浩終于含蓄的回應了……

      項立剛單方面叫陣5天后,羅永浩終于含蓄的回應了……

      柴狗夫斯基
      2025-12-26 11:03:31
      廣州市南沙一棟兩層住宅樓拍賣,被人底價撿漏18.72萬元就競得

      廣州市南沙一棟兩層住宅樓拍賣,被人底價撿漏18.72萬元就競得

      冬天來旅游
      2025-12-26 12:36:15
      凱特王妃2025全年上演“王冠時刻”,已進入準王后之姿!

      凱特王妃2025全年上演“王冠時刻”,已進入準王后之姿!

      ChicMyGeek
      2025-12-26 19:10:04
      深夜大瓜!曝闞清子生下女兒沒保住,沒有膀胱和肛門,產前狀態差

      深夜大瓜!曝闞清子生下女兒沒保住,沒有膀胱和肛門,產前狀態差

      照亮你的前行之路
      2025-12-24 03:10:08
      林子祥葉蒨文上海壓馬路!78歲白發蒼蒼卻牽手依舊!

      林子祥葉蒨文上海壓馬路!78歲白發蒼蒼卻牽手依舊!

      娛樂領航家
      2025-12-25 22:00:03
      2025-12-26 19:48:49
      少女心盜夢賊
      少女心盜夢賊
      少女盜夢賊
      92文章數 100關注度
      往期回顧 全部

      科技要聞

      收割3000億!拼多多"土辦法"熬死所有巨頭

      頭條要聞

      女老板補辦合作伙伴身份證轉走600多萬 事后僅被拘5天

      頭條要聞

      女老板補辦合作伙伴身份證轉走600多萬 事后僅被拘5天

      體育要聞

      開翻航母之后,他決定親手造一艘航母

      娛樂要聞

      王傳君生病后近照變化大,面部浮腫

      財經要聞

      投資巨鱷羅杰斯最新持倉:只留四種資產

      汽車要聞

      兩大CEO試駕 華為乾崑*啟境開啟首款獵裝轎跑路測

      態度原創

      時尚
      房產
      教育
      本地
      公開課

      冬天,“大衣”是中年女人的穿搭剛需,這樣搭配時髦提氣質

      房產要聞

      炸裂,三亞360億超級清單發布,又一批重大配套要來了!

      教育要聞

      孩子只“指”不“說”?三招引導他主動開口

      本地新聞

      云游安徽|踏訪池州,讀懂山水間的萬年史書

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 夜夜添无码试看一区二区三区| 亚洲天堂人妻| 欧美成人影院亚洲综合图| 中文字幕久热精品视频在线| 夜色福利站WWW国产在线视频 | 两个人看的www| 精品人妻无码一区二区三区| 成人性生交大片免费看视频app| 人妻聚色窝窝人体WWW一区| 国产精品?制服丝袜?中文字幕| 伊人色亚洲| 日本一道高清一区二区三区| 超碰人人爱| 国产精品性爱| 亚洲色一区二区三区四区| 麻花传媒在线观看免费| 日韩AV免费| 亚洲黄色精品| 亚洲2022国产成人精品无码区| 亚洲国产在一区二区三区| 天堂a?中文在线| 中文日韩人妻| 欧美 亚洲 中文 国产 综合| 午夜免费福利小电影| 精品熟女999| 中文字幕人妻宗合另类| 国产精品毛片一区二区三区| 亚洲综合天堂一区二区三区| 国产精品9| 日本无遮挡真人祼交视频| 国产自在自线午夜精品| 影音先锋91| 一本伊人久久| 色综合色综合久久综合频道88 | 美女扒开尿口让男人桶| 无码成人AV在线看免费| 成人做爰A片免费看奶头| 乱人伦??国语对白| 国产爆乳无码一区二区麻豆| 麻豆国产成人AV在线播放| 性欧美高清|