<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      AI智能體也有「蜘蛛感應」,防御延時驟降至8.3%

      0
      分享至


      新智元報道

      編輯:LRST

      【新智元導讀】不再依賴像「安檢站」一樣每步必停的外部插件,首創「內源感知+分層篩選」機制,將Agent防御延時從200%+降至8.3%,安全與效率均達到SOTA級表現!

      傳統的Agent防御機制通常采用強制進行安全檢查的方式,即在 Agent 執行的特定階段,包括Query、Plan、Action、Observation等階段,都強制插入外部安全檢測。這種做法雖然有效,但會切斷了Agent的思維流,導致嚴重的延時積累,成本高昂且反應遲鈍。

      來自上海財經大學、新加坡國立大學、卡耐基梅隆大學等高校和學術組織的研究者們聯合重磅推出Spider-Sense智能體防御框架,通過兩大核心技術打破了這一僵局:利用Intrinsic Risk Sensing將風險意識植入Agent認知流,實現全鏈路的內源性感知;配合Hierarchical Adaptive Screening機制,動態平衡向量檢索與深度推理,實現威脅的自適應篩選。


      論文鏈接:https://arxiv.org/abs/2602.05386

      開源鏈接:https://github.com/aifinlab/Spider-Sense

      基準鏈接:https://huggingface.co/datasets/aifinlab/S2Bench

      該框架讓Agent告別了被動防御,在 Mind2Web和EICU這些主流數據集上在大部分評估標準下均取得最優,在構建出的攻擊數據集上實現了SOTA級的安全與效率雙優表現。

      Spider-Sense提出了一種變革性的思路:防御應該是內源的、選擇性的,而非外掛的、強制的。

      該框架賦予Agent一種維持內源性感知風險的能力。Agent 在執行任務的過程中,會自主進行內源性風險感知。

      只有當Agent 「感覺」到工具輸出可疑或者指令中有陷阱等異常的時侯,才會像蜘蛛俠感知到危險一樣,動態觸發防御機制。隨后,系統通過分層自適應篩選,在效率和精度之間找到最佳平衡點。

      關于Spider Sense的解釋:蜘蛛俠平時總是保持放松且高效的行進狀態,只有在突發危險引發「激靈」預警的瞬間,才會下意識地觸發閃避或攔截動作。


      核心優勢與技術突破



      內源性風險感知

      IRS(Intrinsic Risk Sensing)賦予Agent 「原生直覺」,從「外掛監控」到「原生直覺」的進化,傳統防御強制進行安全檢查,笨重且遲鈍。而 Spider-Sense 的靈魂——IRS,則是將安全意識通過指令微調植入 Agent 的推理邏輯中。

      • 全鏈路無死角感知: IRS 并不只盯著用戶的輸入,而是滲透在 Agent 執行任務的四個關鍵生命周期中:

        • Query 階段:審視用戶指令是否存在陷阱。

        • Plan 階段:監控記憶檢索和規劃生成,防止記憶中毒或惡意規劃。

        • Action 階段:審計工具參數是否存在風險。

        • Observation 階段:檢查工具的返回結果,如網頁內容、API 返回值等。

      • 按需觸發: Agent 只有在感知到異常時,才會自主生成特定的感知信號,如 會在 Action 階段觸發。 這說明在 99% 的安全交互中,防御機制是「隱形」的,零延時損耗;只有在真正的危機時刻,它才會像蜘蛛俠的感應一樣瞬間激活。


      分層自適應篩選

      當IRS感知到風險后,HAS(Hierarchical Adaptive Screening)就發揮作用了。

      為了解決大模型推理延遲高與輕量化模型識別精度不足的問題,一旦防御被觸發,系統采用分層式篩選:

      • 粗粒度檢測(Coarse-grained)

        • 機制:系統維護了四個階段的攻擊向量數據庫(Attack Vector Databases)。HAS將可疑內容向量化,與已知攻擊模式進行余弦相似度匹配。

      • 細粒度分析(Fine-grained)

        • 機制:只有當相似度低于閾值,但又不完全安全時,系統會檢索 Top-K 相關案例,并調用 LLM 進行深度對比分析。


      全生命周期防護

      不同于以往僅關注文本輸入輸出的防御,Spider-Sense 覆蓋了 Agent 交互的全鏈路——從用戶輸入(Query)、內部記憶規劃(Plan)、工具參數審計(Action)到觀察工具調用后(Observation),無死角防御。


      實驗結果

      兼并速度與安全

      為了驗證效果,研究團隊構建了一個包含多場景、真實工具調用、多階段攻擊以及高質量假陽性樣本的高質量基準測試集

      高質量假陽性樣本指那些在結構與操作模式上酷似惡意攻擊、但本質意圖完全無害的「高難度」測試用例,專門用于考驗防御系統是否會因過度敏感而誤傷合法的用戶操作

      在實驗中,Spider-Sense展現了令人印象深刻的性能優勢,特別是在處理復雜的多步Agent交互時:

      1. 極低的延遲損耗:相比于基線方法以及 Guardagent 和 AGrail 動輒 197% 到 381% 的額外時間開銷,Spider-Sense 僅多了8.3%的延時。

      2. 主流數據集的表現:框架在Mind2Web和EICU這些主流數據集上展現了卓越的綜合性能。除少數指標外,該方法在大部分評估標準下均取得最優。

      3. SOTA 級防御表現:在全新構建的基準測試中,Spider-Sense取得了最低的攻擊成功率(ASR)

      4. 極低的誤報率:實現了最低的誤報率(FPR),證明了它不僅防得住,而且不會因為過度防御而打斷用戶的正常操作。



      案例研究

      一次真實的攻擊攔截

      看一個具體的工具返回注入攻擊(Tool Return Injection)案例:

      1. 場景:一個臨床分析 Agent 調用工具獲取患者記錄。

      2. 攻擊:工具返回的內容被篡改,包含隱藏的惡意代碼(import fake_module),試圖誘導 Agent 執行。

      3. 感知:Agent 在 Observation(工具調用后階段) 敏銳地感知到了工具返回值的異常,觸發 信號。

      4. 篩選:首先進行數據庫檢索,發現與已知攻擊模式相似,隨即調用深度對比分析,判定該代碼與上下文無關且具有危害性。

      5. 結果:Agent自主決定終止執行,攻擊失敗。

      整個過程Agent自主完成,既沒有因噎廢食,也沒有漏過任何蛛絲馬跡。


      結論與展望

      內源驅動,降本增效,Spider-Sense將安全防御從「外掛監控」轉變為「原生直覺」。依靠IRS和HAS兩大機制,以僅8.3%的延時代價在上實現了 SOTA 級防御效果,完美解決了安全與效率的沖突。

      參考資料:

      https://arxiv.org/abs/2602.05386


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      前中興副所長:中國光刻機正在清場式領先,競爭對手連湯都喝不上

      前中興副所長:中國光刻機正在清場式領先,競爭對手連湯都喝不上

      林子說事
      2026-02-21 13:36:50
      中國隊爆冷又奪1金!冬奧獎牌榜:前十僅1支亞洲隊,韓國排名飆升

      中國隊爆冷又奪1金!冬奧獎牌榜:前十僅1支亞洲隊,韓國排名飆升

      何老師呀
      2026-02-21 05:47:30
      “堅持計劃生育一百年不動搖”的彭佩云去世,她父親的人生更傳奇

      “堅持計劃生育一百年不動搖”的彭佩云去世,她父親的人生更傳奇

      文史微鑒
      2025-12-24 23:47:43
      特朗普“和平委員會”首秀,越南蘇林親自赴美捧場,俄羅斯沒人去

      特朗普“和平委員會”首秀,越南蘇林親自赴美捧場,俄羅斯沒人去

      全球沸點直擊
      2026-02-21 00:42:32
      央媒就扶起老人反被訛發聲!如果要自證清白,公安機關要主動介入

      央媒就扶起老人反被訛發聲!如果要自證清白,公安機關要主動介入

      小熊侃史
      2026-01-19 07:35:08
      臺軍女飛行員郭文靜:只要長官敢下令,我會毫不猶豫的擊落殲20!

      臺軍女飛行員郭文靜:只要長官敢下令,我會毫不猶豫的擊落殲20!

      顧史
      2026-01-21 21:04:39
      生姜立大功?美國研究發現:生姜可在48小時內清除50%老化細胞?

      生姜立大功?美國研究發現:生姜可在48小時內清除50%老化細胞?

      39健康網
      2026-02-11 09:11:33
      做完手術人就廢了,這5種手術不需要做,別讓無知害了自己

      做完手術人就廢了,這5種手術不需要做,別讓無知害了自己

      醫學科普匯
      2026-01-29 06:25:03
      陽光城集團杭州項目破產清算

      陽光城集團杭州項目破產清算

      地產微資訊
      2026-02-21 16:32:24
      打人夫妻惡行全網震怒!下手兇狠傷少女,當地文旅賬號徹底淪陷

      打人夫妻惡行全網震怒!下手兇狠傷少女,當地文旅賬號徹底淪陷

      王姐懶人家常菜
      2026-02-21 23:14:01
      研究顯示:“獵鷹9”火箭解體致高空大氣鋰原子濃度飆升10倍

      研究顯示:“獵鷹9”火箭解體致高空大氣鋰原子濃度飆升10倍

      界面新聞
      2026-02-20 16:34:02
      鞋子買小了擠腳怎么辦?鞋廠老板教我正確方法,鞋子立馬變舒適!

      鞋子買小了擠腳怎么辦?鞋廠老板教我正確方法,鞋子立馬變舒適!

      妙招酷
      2026-02-21 00:20:05
      B席本賽季英超8次染黃,追平個人單賽季最多紀錄

      B席本賽季英超8次染黃,追平個人單賽季最多紀錄

      懂球帝
      2026-02-22 07:25:07
      高人預測:十年后的東莞,真正值錢的只有這5個板塊,別選錯!

      高人預測:十年后的東莞,真正值錢的只有這5個板塊,別選錯!

      小陸搞笑日常
      2026-02-21 22:37:08
      某魚驚現“天價筆”:800元一支的中性筆,藏著多少骯臟暗語?

      某魚驚現“天價筆”:800元一支的中性筆,藏著多少骯臟暗語?

      戧詞奪理
      2026-01-24 16:05:41
      人到60歲,想安安穩穩再活20年,記住了四個不要,非常重要!

      人到60歲,想安安穩穩再活20年,記住了四個不要,非常重要!

      醫學原創故事會
      2026-02-17 21:58:04
      45萬換新肝?海南明碼標價的干細胞成果出爐,或惠及700萬硬化者

      45萬換新肝?海南明碼標價的干細胞成果出爐,或惠及700萬硬化者

      番茄健康
      2026-02-21 18:20:03
      以為只是小毛病,一查竟是晚期!做完所有治療,他還是永遠離開了

      以為只是小毛病,一查竟是晚期!做完所有治療,他還是永遠離開了

      新時代的兩性情感
      2026-02-18 08:36:45
      脂肪肝有救了!上交大連發兩篇:多吃這種碳水,肝臟脂肪減少30%

      脂肪肝有救了!上交大連發兩篇:多吃這種碳水,肝臟脂肪減少30%

      番茄健康
      2026-02-21 21:39:53
      女人都喜歡被命令、喜歡被帶領,但就是不喜歡被尊重、被給選擇

      女人都喜歡被命令、喜歡被帶領,但就是不喜歡被尊重、被給選擇

      加油丁小文
      2026-02-22 07:00:04
      2026-02-22 07:39:00
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      14566文章數 66631關注度
      往期回顧 全部

      科技要聞

      智譜上市1月漲5倍,市值超越京東、快手

      頭條要聞

      貝加爾湖7名遇難者身份全部確認 1家4口僅1人生還

      頭條要聞

      貝加爾湖7名遇難者身份全部確認 1家4口僅1人生還

      體育要聞

      徐夢桃:這是我第一塊銅牌 給我換個吉祥物

      娛樂要聞

      黃曉明澳門賭博輸十幾億 本人親自回應

      財經要聞

      一覺醒來,世界大變,特朗普改新打法了

      汽車要聞

      比亞迪的“顏值擔當”來了 方程豹首款轎車路跑信息曝光

      態度原創

      本地
      時尚
      健康
      手機
      公開課

      本地新聞

      春花齊放2026:《駿馬奔騰迎新歲》

      冬天穿衣盡量別露腿,這些基礎穿搭可嘗試,簡單大方又不挑人

      轉頭就暈的耳石癥,能開車上班嗎?

      手機要聞

      小米8500mAh電池新機曝光,下半年還有萬級方案

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版