<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      攻破閉源多模態大模型:一種基于特征最優對齊的新型對抗攻擊方法

      0
      分享至



      近年來,多模態大語言模型(MLLMs)取得了令人矚目的突破,在視覺理解、跨模態推理、圖像描述等任務上表現出強大的能力。然而,隨著這些模型的廣泛部署,其潛在的安全風險也逐漸引起關注。

      研究表明,MLLMs 同樣繼承了視覺編碼器對抗脆弱性的特征,容易受到對抗樣本的欺騙。這些對抗樣本在現實應用中可能導致模型輸出錯誤或泄露敏感信息,給大規模模型的安全部署帶來嚴重隱患。

      在此背景下,如何提升對抗攻擊的可遷移性 —— 即對抗樣本跨模型、尤其是跨閉源模型仍能保持攻擊有效性 —— 成為當前研究的關鍵難題。

      然而,當面對如 GPT-4、Claude-3 等強大的閉源商業模型時,現有攻擊方法的遷移效果顯著下降。原因在于,這些方法通常僅對齊全局特征(如 CLIP 的 [CLS] token),而忽略了圖像補丁(patch tokens)中蘊含的豐富局部信息,導致特征對齊不充分、遷移能力受限。

      為解決這一難題,本文提出了一種名為FOA-Attack(Feature Optimal Alignment Attack)的全新靶向遷移式對抗攻擊框架。該方法的核心思想是同時在全局和局部兩個層面實現特征的最優對齊,從而顯著提升攻擊的遷移能力。

      • 在全局層面,通過余弦相似度損失來對齊粗粒度的全局特征。
      • 在局部層面,創新性地使用聚類技術提取關鍵的局部特征模式,并將其建模為一個最優傳輸(Optimal Transport, OT)問題,實現細粒度的精準對齊。
      • 此外,本文還設計了一種動態集成權重策略,在攻擊生成過程中自適應地平衡多個模型的影響,進一步增強遷移性。

      大量實驗表明,FOA-Attack 在攻擊各種開源及閉源 MLLMs 時,性能全面超越了現有 SOTA 方法,尤其是在針對商業閉源模型的攻擊上取得了驚人的成功率,且本工作對應的論文和代碼均已開源。



      • 論文鏈接:https://arxiv.org/abs/2505.21494
      • 代碼鏈接:https://github.com/jiaxiaojunQAQ/FOA-Attack

      研究背景

      多模態大語言模型(MLLMs),如 GPT-4o、Claude-3.7 和 Gemini-2.0,通過融合視覺和語言能力,在圖像理解、視覺問答等任務上展現了非凡的性能。然而,這些模型繼承了其視覺編碼器的脆弱性,容易受到對抗樣本的攻擊。對抗樣本通過在原始圖像上添加人眼難以察覺的微小擾動,就能誘導模型產生錯誤的輸出。

      對抗攻擊分為非目標攻擊(旨在使模型輸出錯誤)目標攻擊(旨在使模型輸出特定的目標內容)。對于無法訪問模型內部結構和參數的黑盒場景(尤其是商業閉源模型),實現高效的目標遷移攻擊極具挑戰性。

      這意味著,在一個或多個替代模型(surrogate models)上生成的對抗樣本,需要能夠成功欺騙一個完全未知的黑盒目標模型。盡管現有工作已證明了這種攻擊的可行性,但其遷移成功率,特別是針對最先進的閉源 MLLMs 時,仍有很大的提升空間。

      動機和理論分析

      在多模態大語言模型(MLLMs)依賴的 Transformer 架構視覺編碼器(如 CLIP)中,存在明確的特征分工:[CLS] token 提煉圖像宏觀主題(如「大象」「森林」),但會舍棄細粒度細節;patch tokens 則編碼局部信息(如「大象耳朵形態」「植被密度」),是模型精準理解圖像的關鍵,缺失會導致對抗樣本語義真實性不足。

      現有對抗攻擊方法的核心局限的是,僅聚焦 [CLS] token 全局特征對齊,忽略 patch tokens 的局部價值,引發兩大問題:一是語義對齊不充分,全局特征難區分「大象在森林」與「大象在草原」這類細節差異,局部特征卻能清晰界定;二是遷移性差,擾動過度適配替代模型的全局特征,閉源 MLLMs(如 GPT-4o)因視覺編碼器設計不同,易識別「虛假語義」,攻擊效果驟降。

      為突破此局限,FOA-Attack 提出「全局 + 局部」雙維度對齊思路(如圖 1 所示):

      圖 1 (a) 中「特征最優對齊損失」包含兩大模塊,全局層面用余弦相似度損失對齊 [CLS] token,保證整體語義一致;局部層面通過聚類提取關鍵模式,將對齊建模為最優傳輸(OT)問題(右側「Optimal Transmission」),用 Sinkhorn 算法實現細粒度匹配。

      圖 1 (b) 的「動態集成模型權重策略」則讓多編碼器并行生成對抗樣本,依收斂速度自適應調權 —— 易優化模型權重低、難優化模型權重高,避免偏向單一模型特征。兩者互補,解決了單一維度對齊缺陷,顯著提升對開源及閉源 MLLMs 的攻擊遷移性。



      圖 1: FQA-Attack 示意圖

      方法

      FOA-Attack 以生成「語義對齊、遷移性強」的對抗樣本為核心目標,通過三個協同模塊構建攻擊框架,且所有設計均基于對多模態模型特征機制與對抗遷移性的深度優化。













      最后是動態集成模型權重模塊,解決傳統多模型集成「權重均等易偏科」的問題。以 ViT-B/16、ViT-B/32 等 CLIP 變體為替代模型,先定義「學習速度」Si (T)(第 i 個模型第 T 步與 T?1 步的損失比值,比值越小學習越快),再根據學習速度自適應調整權重 —— 學習慢的模型權重更高,避免優化偏向易適配模型。核心權重公式與總損失公式分別為:





      實驗效果

      開源模型



      表 1:在不同開源模型上的攻擊成功率(ASR)與語義相似度(AvgSim)

      在 Qwen2.5-VL、LLaVA、Gemma 等開源模型上,FOA-Attack 的攻擊成功率(ASR)和語義相似度(AvgSim)顯著高于 M-Attack、AnyAttack 等方法。

      閉源模型



      表 2:在不同閉源模型上的攻擊成功率(ASR)和語義相似度(AvgSim)

      對 GPT-4o、Claude-3.7、Gemini-2.0 等商業閉源模型,FOA-Attack 表現尤為突出:尤其在 GPT-4o 上,FOA-Attack 的 ASR 達到 75.1%。

      推理增強模型



      表 3:在不同推理增強模型上的攻擊成功率(ASR)和語義相似度(AvgSim)

      即使對 GPT-o3、Claude-3.7-thinking 等推理增強模型(理論上更魯棒),FOA-Attack 仍能突破,這表明推理增強模型的視覺編碼器仍存在脆弱性,FOA-Attack 的「全局 + 局部」對齊策略能有效利用這一漏洞。

      可視化



      圖 3:原始干凈圖像、對抗圖像和擾動圖像的可視化

      結語

      FOA-Attack 揭示:通過同時精細對齊全局與局部特征,并在多模型集成中做動態平衡,可以顯著提升目標式對抗樣本對閉源 MLLMs 的遷移性。研究一方面暴露了當前 MLLMs 在視覺編碼階段的脆弱面,另一方面也為防御方向提供了新的思路(例如如何在局部特征層面加固魯棒性)。作者在論文中也討論了效率和計算成本的限制,并給出未來改進方向。

      目前,論文與代碼已公開,歡迎感興趣的同學閱讀,復現以及深入討論。

      作者介紹

      本文作者分別來自新加坡南洋理工大學、阿聯酋 MBZUAI、新加坡 Sea AI Lab 以及美國伊利諾伊大學香檳分校(UIUC)第一作者加小俊為新加坡南洋理工大學博士后。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      90年代意甲最佳陣容發布:全是巨星 卻擠掉德爾皮耶羅 維埃里?

      90年代意甲最佳陣容發布:全是巨星 卻擠掉德爾皮耶羅 維埃里?

      體壇八點半的那些事兒
      2025-12-17 20:56:56
      2025年11月業界作品精選

      2025年11月業界作品精選

      素然追光
      2025-12-18 00:12:35
      日本乒壇害怕國乒拒絕赴日參賽,水谷隼:可能和熊貓一起離開我們

      日本乒壇害怕國乒拒絕赴日參賽,水谷隼:可能和熊貓一起離開我們

      楊華評論
      2025-12-16 21:22:05
      《喜人2》收官、《喜劇之戰》入場:觀眾渴望怎樣的“快樂老家”

      《喜人2》收官、《喜劇之戰》入場:觀眾渴望怎樣的“快樂老家”

      娛樂獨角獸
      2025-12-16 23:26:11
      喜訊!兩位久違強援確定明年回上港,都是穆斯卡剛接手時力捧的人

      喜訊!兩位久違強援確定明年回上港,都是穆斯卡剛接手時力捧的人

      振剛說足球
      2025-12-17 11:16:24
      女子連續加班半個月,每天僅睡5-6小時,一覺醒來突發頭痛,腦中測出大量病毒,醫生:病毒性腦膜炎或與長期熬夜有關

      女子連續加班半個月,每天僅睡5-6小時,一覺醒來突發頭痛,腦中測出大量病毒,醫生:病毒性腦膜炎或與長期熬夜有關

      大象新聞
      2025-12-17 00:13:08
      美女打屁股大賽,火了

      美女打屁股大賽,火了

      微微熱評
      2025-10-08 22:10:24
      盧秀燕在市議會答詢時叫囂:不管是哪個國籍,包括中國、美國……

      盧秀燕在市議會答詢時叫囂:不管是哪個國籍,包括中國、美國……

      南權先生
      2025-12-17 16:48:58
      國劇盛典:任嘉倫面相變了,陳都靈嫩的能掐出水,賈靜雯可真敢穿

      國劇盛典:任嘉倫面相變了,陳都靈嫩的能掐出水,賈靜雯可真敢穿

      娛樂圈筆娛君
      2025-12-17 11:12:51
      新郎準備下葬了,和解了,退了全部禮金,簽了協議,不再追究女方

      新郎準備下葬了,和解了,退了全部禮金,簽了協議,不再追究女方

      丁丁鯉史紀
      2025-10-20 08:34:23
      今天下午3點,U15東亞杯焦點戰:中國vs日本,1-0=爆冷,央5不播

      今天下午3點,U15東亞杯焦點戰:中國vs日本,1-0=爆冷,央5不播

      大秦壁虎白話體育
      2025-12-18 00:58:41
      沐曦股份比摩爾還夸張,一簽賺40萬了,財富流向真的變了

      沐曦股份比摩爾還夸張,一簽賺40萬了,財富流向真的變了

      販財局
      2025-12-17 13:18:19
      灰絲:男人心中的神

      灰絲:男人心中的神

      疾跑的小蝸牛
      2025-12-17 16:02:51
      丁嘉麗:我這輩子最后悔的決定,就是捧紅孫紅雷這個“白眼狼”

      丁嘉麗:我這輩子最后悔的決定,就是捧紅孫紅雷這個“白眼狼”

      小熊侃史
      2025-12-17 09:46:44
      廣東力克浙江,薩姆納21分,王少杰薩林杰徐杰給力,焦泊喬拉胯

      廣東力克浙江,薩姆納21分,王少杰薩林杰徐杰給力,焦泊喬拉胯

      阿錯田間生活
      2025-12-18 00:49:58
      解決就業:“外賣”、“快遞”、“網約車”,迎來了一個新伙伴!

      解決就業:“外賣”、“快遞”、“網約車”,迎來了一個新伙伴!

      辰星雜談
      2025-12-17 11:20:11
      都體談戴維低迷原因:性格內向、語言困難并且遭到老隊員孤立

      都體談戴維低迷原因:性格內向、語言困難并且遭到老隊員孤立

      懂球帝
      2025-12-17 10:55:02
      這可能是2026年A股最大的利好!

      這可能是2026年A股最大的利好!

      小白讀財經
      2025-12-17 16:40:51
      向華強77歲生日蛋糕簡單有愛,和向太摟著孫女拍照,笑得合不攏嘴

      向華強77歲生日蛋糕簡單有愛,和向太摟著孫女拍照,笑得合不攏嘴

      有范又有料
      2025-12-17 12:57:46
      何晴有多美?01年生完孩子上節目,穿著隨意胖過李湘,卻柔情萬分

      何晴有多美?01年生完孩子上節目,穿著隨意胖過李湘,卻柔情萬分

      真的八卦小學弟
      2025-12-17 20:40:07
      2025-12-18 01:35:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11943文章數 142512關注度
      往期回顧 全部

      科技要聞

      特斯拉值1.6萬億靠畫餅 Waymo值千億靠跑單

      頭條要聞

      捐贈博物館價值8800萬的名畫現身拍賣市場 捐贈方發聲

      頭條要聞

      捐贈博物館價值8800萬的名畫現身拍賣市場 捐贈方發聲

      體育要聞

      短短一年,從爭冠到0勝墊底...

      娛樂要聞

      狗仔曝熱播劇姐弟戀真談了???

      財經要聞

      重磅信號!收入分配制度或迎重大突破

      汽車要聞

      一車多動力+雙姿態 長城歐拉5上市 限時9.18萬元起

      態度原創

      手機
      旅游
      本地
      教育
      家居

      手機要聞

      真我16 Pro系列外觀曝光,還有10000mAh±電池機型

      旅游要聞

      泰山桃花峪游覽路調整開放時間

      本地新聞

      云游安徽|踏過戰壕與石板,讀一部活的淮北史

      教育要聞

      高三一輪復習,別太聰明,踏實一點

      家居要聞

      溫馨獨棟 駝色與淺色碰撞

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 韩国三级+mp4| 欧美老妇熟妇???亚洲日韩| 99精品国产一区二区三区不卡| 中文字幕亚洲在线| 一区二区三区国产亚洲网站| 日韩欧美猛交xxxxx无码| 性色欲情网站| 青青草99| 国产精品美女| 狠狠色噜噜狠狠狠狠97俺也去| 丁香婷婷五月| 加勒比无码人妻东京热| 国产亚洲精品久久久久久牛牛| 美姑县| 人妻?无码?中出| 亚洲精品成人无码熟妇在线| 九色91| 男女猛烈激情xx00免费视频| 亚洲熟妇无码爱v在线观看| 欧美日韩在线第一页免费观看| 性xxxx视频播放免费| 亚洲成a无码| 97久久超碰国产精品2021| 好男人社区www在线观看 | 台湾佬久久| 激情久久久| 中文无码一区二区不卡av| 人妻中文字幕久久| 亚洲成人www| 久久av高潮av无码av喷吹| 亚洲综合伊人久久大杳蕉| 亚洲日韩AV无码专区影院| 色屁屁www影院免费观看入口| 又污又爽又黄的网站| 亚洲中文字幕成人无码| 亚洲17P| 欧美精品99久久久| 欧美色综合天天久久综合精品| 香蕉亚洲欧洲在线一区 | 国产三级a三级三级| av无码天堂|