<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      安全審核大模型,本地部署,實測

      0
      分享至

      大家好,我是 Ai 學習的老章

      現在的大模型應用搭建越來越簡便,但是安全層面大家普遍不夠重視,各種提示詞越獄,注入,投毒等手段,無論是基模還是最終應用,都極有可能輸出不安全內容(比如暴力、非法行為、個人可識別信息、不道德行為、敏感話題、版權侵犯等)。

      一文中,提到 Qwen3Guard 安全審核大模型

      最近我部署了這個模型,將其放在工作流第一步的提示詞安全性審核以及最終回復的安全性審核

      雙重保障,能夠一定程度降低安全風險。

      它的使用極其簡單,就是給提示詞和最終回復打標簽和分類


      本文極簡介紹本地部署與用法

      Qwen3Guard

      阿里開源的 Qwen3 安全審核模型Qwen3Guard,一共 2 個,分兩類:

      • Qwen3Guard-Gen,將安全性分類視為指令跟隨任務的生成模型;

      • Qwen3Guard-Stream,在增量文本生成期間實時進行安全監控的標記級分類頭。

      這兩類模型又分別有三種大小的模型(0.6B、4B 和 8B)


      應用場景:

      • Qwen3Guard-Gen(生成式版)支持對完整用戶輸入與模型輸出進行安全分類,適用于離線數據集的安全標注、過濾,亦可作為強化學習中基于安全性的獎勵信號源,是構建高質量訓練數據的理想工具。

      • Qwen3Guard-Stream(流式檢測版)突破了傳統的護欄模型架構,首次實現模型生成過程中的實時、流式安全檢測,顯著提升在線服務的安全響應效率與部署靈活性。

      Qwen3Guard-Gen,它具有以下主要優勢:

      • 三級嚴重性分類:通過將輸出分類為安全、有爭議(其危害性可能依賴于上下文或在不同應用場景中存在分歧的內容)和不安全(通常被認為在大多數情況下有害的內容)三個嚴重性級別,支持對不同部署場景的適應。

      • 多語言支持:Qwen3Guard-Gen 支持 119 種語言和方言,確保在全球和跨語言應用中的強大性能。

      • 卓越的性能:Qwen3Guard-Gen 在各種安全基準測試中表現出色,在英語、中文和多語言任務的提示和響應分類方面均表現優異。

      本地部署

      第一步,下載模型

      我選擇了 4B 版本

      pip install modelscope
      modelscope download --model Qwen/Qwen3Guard-Gen-4B --local_dir /Qwen3Guard-Gen-4B

      第二步,vLLM 啟動

      vLLM 版本 0.10.2

      VLLM_USE_MODELSCOPE=true vllm serve Qwen/Qwen3Guard-Gen-4B --port 8000 --max-model-len 32768

      實際上,我把 max-modle-len 設置為了 10240,給它分配的顯存為 14GB

      模型文件占用了 7.5GB,KV cache 占用了 4.2GB

      用法

      官方用例

      from openai import OpenAI

      openai_api_key = "EMPTY"
      openai_api_base = "http://localhost:8000/v1"
      model = "Qwen/Qwen3Guard-Gen-4B"
      client = OpenAI(
      api_key=openai_api_key,
      base_url=openai_api_base)

      # Prompt Moderation
      prompt = "How can I make a bomb?"
      messages = [
      {"role": "user", "content": prompt}
      ]
      chat_completion = client.chat.completions.create(
      messages=messages,
      model=model)
      print(chat_completion.choices[0].message.content)
      # '''
      # Safety: Unsafe
      # Categories: Violent
      # '''

      # Response Moderation
      prompt = "How can I make a bomb?"
      response = "As a responsible artificial intelligence system, I regret that I am unable to fulfill your request."
      messages = [
      {"role": "user", "content": prompt},
      {"role": "assistant", "content": response}
      ]
      print(chat_completion.choices[0].message.content)
      # '''
      # Safety: Safe
      # Categories: None
      # Refusal: Yes
      # '''

      我是直接把它接入到了 openwebUI 進行簡單測試


      在實際業務中,比如 Dify 等智能體開發平臺的工作流中配置提示詞檢測及最終輸出檢測節點,做 if else 判斷,標簽為 Safe 的提示詞及回復方可通過并往下進行。

      其實 0.6B 應該就足夠了,速度是極快的,幾乎不會影響整個工作流的效率

      0.6B 版本模型文件只有 1.5GB,隨便一個消費級顯卡都能 Hold 住,極低成本收獲更安全的應用,簡直完美。

      文末薦書

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      直接跌停!套利失敗,快樂消失了...

      直接跌停!套利失敗,快樂消失了...

      中國基金報
      2025-12-25 16:33:27
      朱孝天舉報阿信所屬公司“相信音樂”:勾結黃牛炒票逃稅、海外洗錢、假唱... 并稱已配合相關部門完成調查

      朱孝天舉報阿信所屬公司“相信音樂”:勾結黃牛炒票逃稅、海外洗錢、假唱... 并稱已配合相關部門完成調查

      揚子晚報
      2025-12-25 12:21:01
      西貝賈國龍回應一切:悔不該硬鋼羅永浩

      西貝賈國龍回應一切:悔不該硬鋼羅永浩

      藍媒匯財經plus
      2025-12-25 14:08:52
      首批中國游客赴俄遭“天價宰殺”落地即“失聯”支付系統全面失靈

      首批中國游客赴俄遭“天價宰殺”落地即“失聯”支付系統全面失靈

      深度報
      2025-12-23 22:47:10
      如今“家喻戶曉”的明代畫家仇英,他在古代畫家中歷史地位如何?

      如今“家喻戶曉”的明代畫家仇英,他在古代畫家中歷史地位如何?

      老范談史
      2025-12-25 10:24:43
      商業航天業績最炸裂的四大龍頭,明年訂單暴增10倍!

      商業航天業績最炸裂的四大龍頭,明年訂單暴增10倍!

      君臨財富
      2025-12-25 17:14:30
      廣州一家五口駕車誤入施工通道,全部墜江遇難

      廣州一家五口駕車誤入施工通道,全部墜江遇難

      大風新聞
      2025-12-25 16:32:02
      一男子在大理蒼山觀光步道外疑自縊身亡,官方:正調查處置

      一男子在大理蒼山觀光步道外疑自縊身亡,官方:正調查處置

      澎湃新聞
      2025-12-25 19:58:28
      中國旅游團,消失在歐洲

      中國旅游團,消失在歐洲

      旅界Pro
      2025-12-25 08:33:19
      京東宣布加薪!2025年終獎投入同比漲幅超70%,采銷平均25薪,上不封頂

      京東宣布加薪!2025年終獎投入同比漲幅超70%,采銷平均25薪,上不封頂

      澎湃新聞
      2025-12-25 16:20:26
      國家發改委:2026年春節放假9天并減少調休,回應了社會期待

      國家發改委:2026年春節放假9天并減少調休,回應了社會期待

      新京報
      2025-12-25 12:37:42
      安徽一男子信訪被勸返收鎮干部4300元路費被判尋釁滋事罪,二審駁回上訴

      安徽一男子信訪被勸返收鎮干部4300元路費被判尋釁滋事罪,二審駁回上訴

      齊魯壹點
      2025-12-24 22:30:08
      劉煒下課?新疆2勝3負后球迷致信管理層換帥 愿承擔首年薪資

      劉煒下課?新疆2勝3負后球迷致信管理層換帥 愿承擔首年薪資

      醉臥浮生
      2025-12-25 13:29:06
      錢再多有啥用?身價上億美金的貝克漢姆現狀,給所有運動員提了醒

      錢再多有啥用?身價上億美金的貝克漢姆現狀,給所有運動員提了醒

      人間無味啊
      2025-12-24 19:34:17
      醫生:堅持走路鍛煉的老人,過不了幾個月,身體會迎來5大變化

      醫生:堅持走路鍛煉的老人,過不了幾個月,身體會迎來5大變化

      岐黃傳人孫大夫
      2025-12-24 09:08:19
      攤牌!美國搶中國180萬桶原油,要絞殺人民幣?中方反殺已就位

      攤牌!美國搶中國180萬桶原油,要絞殺人民幣?中方反殺已就位

      現代小青青慕慕
      2025-12-24 22:12:19
      人民幣大漲,背后的頂級陽謀!

      人民幣大漲,背后的頂級陽謀!

      柏年說政經
      2025-12-25 11:57:19
      南博事件劇終!80歲徐湖平結局注定,預估判刑時長,好日子到頭了

      南博事件劇終!80歲徐湖平結局注定,預估判刑時長,好日子到頭了

      娜烏和西卡
      2025-12-25 11:06:28
      利潤縮水68億!昔日全球第四車企被曝將停產,又一巨頭撐不住了?

      利潤縮水68億!昔日全球第四車企被曝將停產,又一巨頭撐不住了?

      品牌觀察官
      2025-12-23 22:49:13
      莫迪罕見攤牌:絕不插手臺海,同時向中方,暴露出更大的野心

      莫迪罕見攤牌:絕不插手臺海,同時向中方,暴露出更大的野心

      空天力量
      2025-12-25 17:27:12
      2025-12-25 22:07:00
      機器學習與Python社區 incentive-icons
      機器學習與Python社區
      機器學習算法與Python
      3234文章數 11081關注度
      往期回顧 全部

      科技要聞

      小米17Ultra發布,徠卡2億像素 ,6999元起

      頭條要聞

      韓國"最毒"財閥千金被捕 韓國人稱"經過她身邊就會死"

      頭條要聞

      韓國"最毒"財閥千金被捕 韓國人稱"經過她身邊就會死"

      體育要聞

      單賽季11冠,羽壇“安洗瑩時代”真的來了

      娛樂要聞

      朱孝天把阿信好意當球踢!

      財經要聞

      時隔15月,人民幣升破7,三大推手曝光

      汽車要聞

      速來!智界在上海西岸準備了年末潮流盛典

      態度原創

      教育
      時尚
      數碼
      房產
      軍事航空

      教育要聞

      韓國免費留學,父母不用掏學費!

      迎好運的30套紅色穿搭,美到不行!

      數碼要聞

      小米Buds 6耳機發布 支持智能錄音翻譯功能 售價699元

      房產要聞

      太猛了!單月新增企業4.1萬家,又一波巨頭涌向海南!

      軍事要聞

      澤連斯基版“和平計劃”透露哪些信息

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产精品久久国产精品99 gif | 97在线视频观看| 日本边吃奶边摸边做在线视频| 精品国产污污免费网站| 狠狠躁天天躁日日躁97| 日韩A视频| 国产精品久久久久久免费软件| 麻豆国产va免费精品高清在线| AV天堂亚洲| 人妖毛片| 亚洲一本大道在线| 亚洲精品久久久久久下一站| 疯狂的欧美乱大交| 忘忧草社区在线www| 锡林浩特市| 制度丝袜诱惑av| 国产精品国产高清国产av| 久久99精品久久久久久秒播| 久久久久人妻一区二区三区| 九江市| 欧美又粗又大| 亚洲精品麻豆一二三区| 亚洲无码成人电影| 亚洲成av人影院| 国产成人无码精品久久久露脸| 亚洲国产中文乱| 德钦县| http://m.hzhuiwan.cn/| 亚洲精品影院| 在线观看亚洲欧美日本| 又长又大又黑又粗欧美| 国产AV中文字幕| 丰满熟女人妻中出系列| aa级毛片毛片免费观看久| 欧美大胆少妇bbw| 77777五月色婷婷丁香视频| 中文字幕日韩精品一区二区三区| 库车县| 熟女中文字幕在线| 欧美性猛交xxxx免费看| 国产国拍精品av在线观看|