![]()
2025年11月8日,在世界互聯網大會烏鎮峰會期間,三六零數字安全集團(以下簡稱“360”)正式發布《大模型安全白皮書》(以下簡稱“白皮書”)。
![]()
該白皮書首次系統性闡釋大模型運行時的五大關鍵風險,建設性地提出“外筑‘以模治模’動態屏障,內固‘平臺原生’安全底座”的核心理念,并源于實戰,提供了可落地的安全解決方案,為大模型應用拉起了全鏈路安全防線,助力推動人工智能行業向“安全、向善、可信、可控”方向穩健發展。
![]()
![]()
該白皮書共計五章, 系統覆蓋了大模型安全邊界的演變、全景式威脅透視、源于實戰的防護新思路、360全鏈路安全解決方案以及生態共治倡議,全面呈現了360在面對大模型安全這一挑戰的技術縱深與治理前瞻性。
01 范式遷移:從網絡安全到大模型安全的時代挑戰
開篇介紹了隨著大模型驅動百行千業智能化,傳統且清晰網絡安全邊界正在消融。白皮書指出,當前大模型安全漏洞呈指數級增長,2025年國內首次AI大模型實網眾測發現281個安全漏洞,其中大模型特有漏洞占比超60%。與此同時,攻擊者從"專業黑客"演變為"全民黑客",通過自然語言即可發動高威脅攻擊。
![]()
面對這一挑戰,中國開創了“發展與安全并重”的敏捷治理路徑,以《生成式人工智 能服務管理暫行辦法》為代表的“包容審慎、分類分級”原則,為技術創新與風險防控提供了 動態平衡的框架。
02 大模型安全威脅全景透視
本章提到在大模型快速發展與廣泛應用的背景下,大模型安全風險已形成多維度的復雜體系。除了傳統的網絡安全與數據安全解決方案能夠覆蓋的大模型應用環境上的安全問題以外,大模型在運行時的安全風險尤其具有其獨特性。
![]()
大模型運行時安全風險主要涵蓋以下五個關鍵風險點:一是大模型基礎設施安全;二是大模型內容安全;三是大模型數據與知識庫安全;四是智能體安全;五是用戶端安全,涵蓋大模型、知識庫、智能體的訪問控制,API監控及惡意插件、隱私泄露等風險。這些維度共同構成了AI安全治理需重點關注的全域圖景。對于上述風險,傳統的安全廠商尚未提供有效的解決方案。
03 源于實戰:大模型安全的應對思路
在本章,基于對新型威脅的深度洞察,白皮書提出"外筑'以模治模'動態屏障,內固'平臺原生'安全底座"的防護理念,并通過四大原則落地實施:“安全”原則保障大模型運行時的安全防護;“向善”原則引導大模型朝著積極有益的方向發展;“可信”原則致力于提升大模型生成內容的可信度、完整性與準確性;“可控”原則實現智能體有效管理。
![]()
此外,為了推動人工智能行業向以上四大原則方向穩健發展。白皮書基于實戰經驗,給出了“外掛式安全 + 平臺原生安全”雙軌治理策略 ——外掛式安全如同“建成后加裝的防盜系統”,平臺原生安全則如“建造時內置的防火結構”,二者協同,從外至內構筑大模型的安全防線。通過這一體系,360實現了主動發現、動態演進的安全檢測能力,有效應對復雜多變的大模型安全威脅。
04 360解決方案:可全鏈路的安全防護
本章中,360給出了全鏈路安全防護的解決方案。具體而言,“外掛式”安全能力不侵入大模型原生架構,通過外部工具實現靈活、快速的動態防護。
![]()
該體系下的四大產品——大模型衛士算力主機安全系統、檢測系統、防護系統、幻覺檢測與緩解系統——共同構建了外部屏障,重點應對大模型基礎設施風險,如算力劫持、供應鏈投毒,以及大模型內容風險,如提示詞注入、模型幻覺與違規內容,實現了從算力層到內容層的實時監測與主動防御。
![]()
同時,“平臺原生安全” 則為大模型應用注入了“安全基因”,將防護能力深度內嵌于其核心組件之中。這一理念具體體現在三大平臺產品上:企業級知識庫從根本上守護數據與知識安全;智能體構建和運營平臺確保智能體行為全程可控;智能體客戶端則筑牢用戶端入口的安全防線。三者協同,從底層架構解決了數據泄露、智能體行為失控及終端濫用等內生性安全挑戰,為AI應用的穩定可靠運行奠定了內生性基礎。
05 生態共治:構建可信AI生態
最后章節中,白皮書強調,大模型安全需通過生態共治實現可持續治理。360深度參與《GB/T 45654-2025 網絡安全技術 生成式人工智能服務安全基本要求》等國家標準制定,與北京大學聯合研發的TinyR1-32B模型在安全能力上超越多個主流模型。
通過發起大模型安全聯盟,360攜手產學研各方共建安全生態,在工信部人工智能大模型公共服務平臺上,已為100余家企業提供模型安全測試服務。
《大模型安全白皮書》的發布,標志著大模型安全治理進入體系化建設新階段。360提出的全鏈路防護體系,為正處于規模化應用初期的各行各業提供了從理論到實踐的完整解決方案。
未來,360將繼續發揮"AI+安全"雙重基因優勢,與產業各方攜手共建"安全、向善、可信、可控"的大模型生態,為人工智能時代高質量發展保駕護航。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.