<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      AI Agent 是長期運行的“風險系統”,如果你還只在防 Prompt Injection,說明已經落后一代了

      0
      分享至


      作者 | Sergio De Simone

      譯者 | 田橙

      為防止大語言模型和 AI Agent 執行嵌入在外部數據中的惡意指令,所有進入 Agent 上下文的文本在完成校驗之前都必須被視為不可信數據,其中不僅包括用戶輸入的提示,還包括來自外部系統的各類信息。AI 安全公司 CyberArk 的首席軟件架構師 Niv Rabin 表示。為此,他所在的團隊提出了一種基于“指令檢測”(Instruction Detection)與“歷史感知校驗”(History-Aware Validation)的方法,用于同時防御惡意輸入數據和上下文歷史投毒攻擊。

      Rabin 介紹說,團隊設計了多種防御機制,并將其組織成一個分層的處理流水線。流水線中的每一層都針對不同類型的威脅,目的是減少單一防護手段不可避免存在的盲區。

      這些防御措施包括“蜜罐動作”(honeypot actions)以及指令檢測器,用于攔截具備指令特征的文本,確保模型最終接觸到的僅是經過驗證、且不包含指令的數據。同時,這些機制也會應用于整個上下文歷史中,以防止所謂的“歷史投毒”(history poisoning)。這種攻擊方式指的是,原本看似無害的內容片段在多輪交互中逐步累積,最終拼接成一條完整的惡意指令。

      所謂“蜜罐動作”,本質上是一種用于誘捕惡意意圖的安全陷阱,即 Agent 在任何正常業務場景下都不應選擇的合成動作。

      這些動作對應的是一些不會真正執行任何操作的虛擬工具。它們并非用于完成實際任務,而是作為安全信號存在,其工具描述被刻意設計成能夠暴露可疑行為。

      在提示中出現的可疑行為包括對系統內部機制的元層級探測、異常的數據提取嘗試,以及試圖誘導模型泄露系統提示(system prompt)的操縱行為等。如果 LLM 在動作映射階段選擇了其中一個蜜罐動作,通常就意味著存在明顯的異常或越界行為。

      Rabin 指出,真正的安全風險并不主要來自用戶輸入,而是來自外部 API 或數據庫的返回結果。針對這一問題,團隊引入了指令檢測器作為關鍵防護手段。

      這種檢測已經不再是傳統意義上對“惡意內容”的搜索,也并非基于關鍵詞、文本毒性或策略違規的判斷,而是聚焦于識別文本中所蘊含的意圖、行為模式以及指令在結構層面的特征。

      指令檢測器本身是基于 LLM 構建的“裁判模型”。在任何外部數據被送入主模型之前,檢測器都會對其進行審查,并被明確要求識別任何形式的指令,無論其表現得多么直白或隱蔽,從而使系統能夠在第一時間阻斷可疑數據。

      此外,時間也被證明是一種重要的攻擊向量。早期響應中零散存在的惡意指令片段,可能會在后續交互中被重新組合,最終形成一條完整指令。這種現象被稱為“歷史投毒”。

      示意圖展示了一個典型案例:LLM 被要求分別獲取三段數據,單獨來看,這些數據完全無害;但合并在一起后,內容實際拼成了一條指令,要求系統停止處理并返回特定結果。


      為防止歷史投毒,所有歷史 API 響應都會與最新獲取的數據一并提交給指令檢測器,作為一個統一輸入進行分析。

      Rabin 指出,歷史投毒并不是發生在數據進入系統的入口階段,而是發生在系統從歷史記錄中重建上下文的過程中。通過引入這一機制,即便對話歷史中隱藏著試圖干擾模型推理的細微線索,系統也能夠在模型受到影響之前及時發現異常。

      上述所有步驟都會在同一條流水線中運行。一旦任意一個階段檢測到風險,請求就會在模型處理之前被直接攔截;只有通過全部校驗后,模型才會處理已經凈化過的數據。

      Rabin 總結,這種方法的關鍵在于將 LLM 視為一個長期運行、跨多輪交互的工作流系統,而非一次性的請求響應組件。他在原文中對這一方案進行了更為深入的展開,對于關注 AI 安全問題的讀者而言,值得進一步閱讀。

      https://www.infoq.com/news/2026/01/cyberark-agents-defenses/

      聲明:本文為 InfoQ 翻譯,未經許可禁止轉載。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      一定要存錢,我爸去年55歲,有10萬的存款,被很多人笑話

      一定要存錢,我爸去年55歲,有10萬的存款,被很多人笑話

      花小貓的美食日常
      2026-02-23 12:57:35
      播了5集飆上9.1分,HBO最新猛劇終于發威!

      播了5集飆上9.1分,HBO最新猛劇終于發威!

      熱薦電影
      2026-02-21 21:06:40
      她是天生麗質的美女演員,嫁給軍委副主席之子,離婚后成知名畫家

      她是天生麗質的美女演員,嫁給軍委副主席之子,離婚后成知名畫家

      雍親王府
      2026-02-23 15:20:04
      中央定調!公務員取消彈性延退,退休還有啥合法選擇?

      中央定調!公務員取消彈性延退,退休還有啥合法選擇?

      慧眼看世界哈哈
      2026-02-23 13:04:57
      歷史上唯一一位“女狀元”,白天處理政務,晚上淪為玩物

      歷史上唯一一位“女狀元”,白天處理政務,晚上淪為玩物

      談史論天地
      2026-02-23 10:39:15
      高盛定調:黃金不再單邊漲,將是超級過山車

      高盛定調:黃金不再單邊漲,將是超級過山車

      流蘇晚晴
      2026-02-23 12:22:43
      重磅!蘇州市正在規劃的4條地鐵,你最期待哪一條?

      重磅!蘇州市正在規劃的4條地鐵,你最期待哪一條?

      瓜哥的動物日記
      2026-02-23 13:10:24
      王毅外長喊話全球, 直接給日本定了性,話音剛落, 高市早苗已辭職

      王毅外長喊話全球, 直接給日本定了性,話音剛落, 高市早苗已辭職

      軍器戰位
      2026-02-23 01:05:25
      史詩級封殺!2000萬網紅“聽風的蠶”徹底涼了

      史詩級封殺!2000萬網紅“聽風的蠶”徹底涼了

      互聯網品牌官
      2026-02-12 01:17:23
      三球三節37+8+7+10三分生涯新高 黃蜂大勝奇才近14戰11勝

      三球三節37+8+7+10三分生涯新高 黃蜂大勝奇才近14戰11勝

      醉臥浮生
      2026-02-23 09:26:43
      國民黨彰化縣長提名陷僵局,謝衣鳳:會向中央黨部轉達基層聲音

      國民黨彰化縣長提名陷僵局,謝衣鳳:會向中央黨部轉達基層聲音

      海峽導報社
      2026-02-23 15:46:02
      卡塞米羅今夏鐵定離開曼聯,新東家浮出水面,兩大巨星或并肩作戰

      卡塞米羅今夏鐵定離開曼聯,新東家浮出水面,兩大巨星或并肩作戰

      零度眼看球
      2026-02-23 14:59:04
      吳謹言洪堯海南偶遇用餐!二人世界甜度拉滿

      吳謹言洪堯海南偶遇用餐!二人世界甜度拉滿

      手工制作阿殲
      2026-02-23 00:27:44
      華國鋒孫女華真,目前擔任蘇富比亞洲區副主席,此前系李云迪妻子

      華國鋒孫女華真,目前擔任蘇富比亞洲區副主席,此前系李云迪妻子

      老杉說歷史
      2026-02-03 00:39:20
      杭徽高速返程車流驚險一幕,十幾個司機出手!監控記錄下令人動容的4分鐘

      杭徽高速返程車流驚險一幕,十幾個司機出手!監控記錄下令人動容的4分鐘

      都市快報橙柿互動
      2026-02-23 12:01:46
      WTT新加坡大滿貫:奧運亞軍慘遭逆轉!2-0領先連丟3局崩盤

      WTT新加坡大滿貫:奧運亞軍慘遭逆轉!2-0領先連丟3局崩盤

      全言作品
      2026-02-23 14:49:57
      只落后中國1名!韓國隊開冬奧總結會 柳承敏狂批:這1點讓人羞愧

      只落后中國1名!韓國隊開冬奧總結會 柳承敏狂批:這1點讓人羞愧

      風過鄉
      2026-02-23 09:01:06
      42歲小尼新疆家宴曝光!8道菜不見一片綠葉菜太真實!

      42歲小尼新疆家宴曝光!8道菜不見一片綠葉菜太真實!

      東方不敗然多多
      2026-02-22 15:32:45
      伊朗大規模抗議又來了,催哈梅內伊上路

      伊朗大規模抗議又來了,催哈梅內伊上路

      移光幻影
      2026-02-22 17:05:18
      特朗普驚出一身冷汗:中美已無法開戰,一殺手锏讓美軍無計可施

      特朗普驚出一身冷汗:中美已無法開戰,一殺手锏讓美軍無計可施

      馬鞄戶外釣魚哥
      2026-02-22 14:53:23
      2026-02-23 16:20:49
      InfoQ incentive-icons
      InfoQ
      有內容的技術社區媒體
      12068文章數 51762關注度
      往期回顧 全部

      科技要聞

      騰訊字節,“火拼”漫劇

      頭條要聞

      特朗普被指考慮對伊朗先“小打”再“大打”

      頭條要聞

      特朗普被指考慮對伊朗先“小打”再“大打”

      體育要聞

      哈登版騎士首敗:雷霆的冠軍課

      娛樂要聞

      谷愛凌奶奶去世,谷愛凌淚奔

      財經要聞

      結婚五金邁入10萬大關 年輕人結婚更難了

      汽車要聞

      續航1810km!smart精靈#6 EHD超級電混2026年上市

      態度原創

      時尚
      健康
      手機
      游戲
      房產

      今年春天一定要擁有的針織,這樣穿減齡又好看!

      轉頭就暈的耳石癥,能開車上班嗎?

      手機要聞

      蘋果或將在今年的新品發布上采用全新形式

      《生化危機9》女主死亡動畫曝光 或為系列最血腥!

      房產要聞

      窗前即地標!獨占三亞灣C位 自貿港總裁行宮亮相

      無障礙瀏覽 進入關懷版