<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      你以為換個馬甲就安全了?一篇論文扒掉了整個互聯網的底褲

      0
      分享至

      你在互聯網上有幾個馬甲?

      豆瓣上一個,用來打分吐槽爛片,知乎上一個,偶爾回答點專業問題裝裝內行,微博上還有一個,專門發些不想讓同事看見的牢騷。

      你覺得挺安全的,畢竟名字是編的,頭像是隨便找的,從來沒說過自己住哪兒叫什么。誰會閑著沒事來查你呢?就算真要查,翻你幾千條帖子做交叉比對,光人工成本就得好幾萬。(這個數是我瞎猜的)

      這個安全感,最近被一篇論文徹底打碎了。



      2026年2月,AI大魔王公司Anthropic和瑞士蘇黎世聯邦理工學院(ETH Zurich)的研究員聯合發了一篇論文,標題直白到嚇人:《用大語言模型進行大規模線上去匿名化》。(Large-scale online deanonymization with LLMs)

      說人話:用AI把網上的匿名用戶和真人對上號。

      花多少錢呢?1到4美元,一杯美式咖啡的價格。

      一、扒掉你的馬甲

      先說這個實驗是怎么做的。

      研究團隊搭建了一套全自動AI系統,在三組真實數據上做了測試。其中最核心的一組是這樣的:他們收集了一批Hacker News(技術領域的資訊網站)的匿名用戶帖子,去掉所有明顯的身份標識,名字、用戶名、鏈接全刪了,然后讓AI去互聯網上找,看能不能把這些匿名賬號和LinkedIn上的真人簡歷對上。

      結果:338個人里,226個被正確識別,召回率67%,精確率約90%。

      什么意思呢?AI每認出10個人,大約有9個是認對的。

      在同一組數據上,傳統的基于結構化數據匹配方法,召回率是0.1%,幾乎等于零。



      以前,人肉一個匿名用戶的過程可能是花好幾天翻帖子、查蛛絲馬跡、做交叉驗證。費時費力,成本極高,所以大部分人覺得自己是安全的。研究人員管這個叫practical obscurity,實際模糊性。翻譯成大白話:你之所以安全,只是因為查你不劃算。

      這篇論文證明了:這個前提已經不存在了。



      二、AI是怎么開盒的

      你可能會好奇:一個人在網上隨便發了些帖子,又沒寫自己叫什么住哪兒,AI憑什么能鎖定他的真實身份?

      靠的是所有“微數據”的疊加。

      研究人員把AI開盒的過程拆成了四步,然后AI偵探在線拼圖:

      第一步,提取。AI翻遍你的發帖記錄,從那些看似隨意的文字里抽取“身份信號”。你提過自己是做生物研究的?記下來!你用了英式拼寫analysing而不是美式的analyzing?大概率在英國或英聯邦國家。你抱怨孩子秋天要入學了?年齡段和家庭狀況也有了。這些零碎信息被整理成一份半結構化的畫像檔案。

      第二步,搜索。把這份畫像轉化成一組數學向量,然后在幾百萬個候選人的數據庫里跑“最近鄰搜索”,本質上和你用搜索引擎找相似文檔是同一套技術。AI從茫茫人海中篩出一批看起來像的候選人。

      第三步,推理。這一步最關鍵。AI把匿名賬號的畫像和候選人的公開信息擺在一起,開始推理:兩個人都提過同一個冷門學術會議?都對某個小眾導演有獨到見解?用詞習慣高度相似?傳統方法走到這步就徹底斷片了,規則系統沒法理解“兩個人在不同帖子里都用屋頂場景聊甜茶(Timothée Chalamet)”意味著什么。大語言模型可以。

      第四步,校準。AI給每個匹配結果打一個置信度分數。不確定的,不出手,這保證了較低的誤判率。



      四步走完,每一步單獨拎出來看,都像是完全正常的、合法的AI功能:總結文本、語義搜索、內容比對、可信度評分。沒有任何一步是在做壞事,但四步一串,開盒流水線就轉起來了。

      研究者之一Daniel Paleka在采訪里說了一句讓人印象很深的話:“如果你的安全依賴于'沒人會花幾小時來調查我',那么這個模式現在已經崩了。”



      圖|流程大致如此

      三、你聊過的電影越多,越容易被認出來

      上面的實驗聽著可能離自己太遠,畢竟不是每個人都同時有Hacker News和LinkedIn賬號,研究團隊還做了幾組更有日常感的測試。

      比如Reddit電影社區實驗,研究人員從r/movies和幾個相關子版塊收集了用戶的發帖記錄,然后測試AI能否把分散在不同板塊的賬號關聯起來。

      結果發現,能不能認出你,跟你聊過幾部電影強相關:

      • 只提過1部電影的用戶,3.1%的概率被識別(90%精度下)

      • 提過5到9部的,8.4%

      • 提過10部以上的,48.1%





      將近一半,你只是在不同的版塊聊了聊喜歡的電影,AI就能把你的小號全串起來。

      以及Anthropic訪談實驗。這組更夸張,Anthropic之前做過一次內部問卷,問員工和外部參與者平時怎么用AI工具,研究人員拿到了125份匿名回答,然后讓AI試著根據回答內容去互聯網上找到真人。

      結果:9個人被成功識別。

      其中一個案例很有代表性。某位受訪者在問卷里提到“我在生物學領域工作,研究方向是某某課題”“我的背景是物理學”“我和導師最近在討論分析某種現象的影響”。就這些信息,AI先鎖定了一個在英國某大學讀博的學生,然后通過GitHub倉庫和bioRxiv預印本上的記錄交叉驗證。對上了。



      圖|一個非常嚴謹且有效的AI開盒測試案例

      7%的識別率聽起來不高,但這些人既沒發帖,也沒上社交媒體,只是在一份匿名問卷里隨口聊了聊工作,然后就被盯上了。

      論文合著者Simon Lermen說:

      “以前的方法需要結構化數據,兩個格式相似的數據集才能互相匹配。現在AI可以直接從自由文本開始,一路查到你是誰。這是一種全新的能力。”



      四、為什么安全護欄攔不住

      看到這里你可能會想:AI公司不是都在搞安全對齊嗎?給模型加護欄、設拒答規則,不讓它干壞事,不就行了?

      這恰恰是這篇論文最讓人不安的地方。

      它證明了一件事:任務分解可以繞過幾乎所有護欄。

      你直接問一個AI大模型“幫我扒一下這個用戶是誰”,它大概率會拒絕你,但你把這個任務拆開呢?

      • “幫我總結一下這段文字里提到的關鍵信息”,正常需求,通過。

      • “幫我把這些信息轉成向量嵌入”,技術操作,通過。

      • “幫我在這500個候選人里排個序”,推薦系統常用功能,通過。

      • “幫我評估一下這兩個人是不是同一個人”,文本比對,通過。

      每一步都無害,四步連起來,就是一次完整的開盒攻擊。

      光靠AI公司給模型上鎖,鎖不住這條路,你沒法禁止文本摘要,沒法禁止語義搜索,沒法禁止相似度排序,這些是大語言模型最基礎的能力。

      2008年,有過一個轟動一時的案例。Netflix公開了一批用戶的匿名觀影記錄,本意是辦一個算法競賽,兩個研究者用這些數據交叉比對了IMDb的公開評論,成功識別了真人身份,還能看出他們的政治傾向。

      但那次,攻擊者需要兩個格式相近的結構化數據集。現在呢?隨便什么文字都行,你發的豆瓣短評、知乎回答、微博吐槽、貼吧水帖,任何自由文本都是攻擊面。

      電子前線基金會(EFF)的高級技術專家Jacob Hoffman-Andrews說:“大語言模型工作快,而且不會感到無聊。這讓它們成了理想的互聯網偵探。”



      順帶一提,在這項研究公布的前一個月,馬斯克旗下xAI的聊天機器人Grok剛剛鬧出了一件事:一位用了12年藝名的美國成人內容創作者Siri Dahl,被Grok在一次普通對話中直接吐出了真名和家庭住址。她隨后在社交媒體上發帖稱,自己的隱私信息被其他AI爬蟲二次傳播,“散布到了整個互聯網”。

      論文里講的是學術實驗。現實里,它已經在發生了。



      五、然后呢?

      所以普通人該怎么辦?

      論文的合著者們給了一些務實的建議:

      對平臺來說,最有效的短期措施是限制數據獲取,給API加頻率限制、檢測自動爬蟲、限制批量數據導出。這不能消滅威脅,但能把大規模攻擊的成本拉回去。

      對AI服務商來說,單個請求層面的拒答策略意義有限,更有價值的是監控API調用的模式,一個用戶先調用摘要接口、再調用嵌入接口、再調用排序接口,這個序列本身就是信號。

      對個人來說,合著者Joshua Swanson的建議是:如果要發真正敏感的內容,用全新賬號。并且要意識到,暴露你身份的從來不是某一條帖子,而是你所有帖子里那些細節的組合。不同平臺用不同的風格、不同的興趣標簽、不同的表達習慣。把維護匿名身份當成一個真正的安全工程問題來對待,不是換個用戶名就完事了。



      當然,還有最簡單粗暴的一招:少發,或者定期刪帖。

      論文的最后寫了這樣一段話(大概是這么個意思):

      “過去保護匿名用戶主要靠'查你太麻煩',現在這大概已經不管用了。用固定ID發帖的人,應該默認自己的賬號隨時可能被人和真實身份對上號,而且你每多發一條帖子,被認出來的概率就多漲一分。”

      研究人員補充說,他們出于倫理考量,刻意沒有對真正試圖保護隱私的高敏感人群做測試,也故意隱去了部分技術細節以防止被直接濫用。但他們發出了警告:隨著大模型能力持續提升,這種攻擊只會越來越容易、越來越便宜。



      說到底,互聯網匿名從來就不是一種權利,也不是誰精心設計的結果,它只是一個副產品,一個因為人力成本太高而僥幸存在的灰色空間。

      AI正在把這個成本打到4美元。

      這個灰色空間,可能正在被消解。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      母嬰品牌Babycare回應“被檢出重金屬銻”:傳言不實,已報案

      母嬰品牌Babycare回應“被檢出重金屬銻”:傳言不實,已報案

      紅星新聞
      2026-04-11 15:34:31
      寶馬“炮轟”比亞迪:不是我們做不到閃充,是不愿犧牲電池耐用性

      寶馬“炮轟”比亞迪:不是我們做不到閃充,是不愿犧牲電池耐用性

      混沌錄
      2026-04-10 22:53:05
      解鎖單賽季2000分最高齡紀錄!杜蘭特:詹姆斯不在榜單上嗎?

      解鎖單賽季2000分最高齡紀錄!杜蘭特:詹姆斯不在榜單上嗎?

      北青網-北京青年報
      2026-04-11 15:44:18
      道士給弟子教針灸被認定非法行醫,累計收到10萬罰單,算不算“小過重罰”?衛健局:已是最低處罰標準

      道士給弟子教針灸被認定非法行醫,累計收到10萬罰單,算不算“小過重罰”?衛健局:已是最低處罰標準

      大風新聞
      2026-04-10 19:30:03
      誰還記得樟木頭?83萬人次的“終點站”,是那個年代打工人的噩夢

      誰還記得樟木頭?83萬人次的“終點站”,是那個年代打工人的噩夢

      匹夫來搞笑
      2026-04-12 03:28:28
      美伊停火內幕曝光!巴官員:中國本不愿擔保,經巴方勸說才出面

      美伊停火內幕曝光!巴官員:中國本不愿擔保,經巴方勸說才出面

      書寫傳奇
      2026-04-11 15:48:39
      4月11日俄烏最新:俄羅斯的關鍵條件

      4月11日俄烏最新:俄羅斯的關鍵條件

      西樓飲月
      2026-04-11 21:42:50
      什么事讓你瞬間感到毛骨悚然?網友:從此再沒見過她老公發脾氣

      什么事讓你瞬間感到毛骨悚然?網友:從此再沒見過她老公發脾氣

      另子維愛讀史
      2026-03-10 23:08:46
      美以伊爆發沖突以來,為何哈馬斯幾乎保持沉默?

      美以伊爆發沖突以來,為何哈馬斯幾乎保持沉默?

      人生錄
      2026-04-10 21:38:01
      斯諾克戰報!4場10-2,決勝輪已出8席,中國4人晉級,周躍龍大捷

      斯諾克戰報!4場10-2,決勝輪已出8席,中國4人晉級,周躍龍大捷

      劉姚堯的文字城堡
      2026-04-12 07:39:28
      中超本賽季下課第一人預測!坐擁豪華陣容卻連戰連敗,急需爆發

      中超本賽季下課第一人預測!坐擁豪華陣容卻連戰連敗,急需爆發

      振剛說足球
      2026-04-11 10:45:03
      山西49歲局長在辦突發疾病搶救無效離世,小兒子今年6月參加高考,妻子稱丈夫常加班到凌晨兩三點,出事前還接了幾個工作電話

      山西49歲局長在辦突發疾病搶救無效離世,小兒子今年6月參加高考,妻子稱丈夫常加班到凌晨兩三點,出事前還接了幾個工作電話

      極目新聞
      2026-04-11 16:04:10
      瑜伽褲外穿引發爭議,穿著不當或致尷尬局面

      瑜伽褲外穿引發爭議,穿著不當或致尷尬局面

      特約前排觀眾
      2026-03-24 00:15:04
      陳獨秀晚年感慨:我一生最后悔的,不是選錯路,而是忘了看看腳下

      陳獨秀晚年感慨:我一生最后悔的,不是選錯路,而是忘了看看腳下

      曉張說
      2026-04-12 07:05:26
      職稱倒查30年,有問題的正高、副高,追繳不正當待遇追究法律責任

      職稱倒查30年,有問題的正高、副高,追繳不正當待遇追究法律責任

      馬蹄燙嘴說美食
      2026-04-11 13:09:52
      陳麗華年輕照出烏龍:美女照片主人出來辟謠,真實年輕照像韓紅

      陳麗華年輕照出烏龍:美女照片主人出來辟謠,真實年輕照像韓紅

      動物奇奇怪怪
      2026-04-11 15:25:19
      剛從蒙古國回來,說點不中聽的:蒙古國真實面目,可能讓你很意外

      剛從蒙古國回來,說點不中聽的:蒙古國真實面目,可能讓你很意外

      復轉這些年
      2026-04-06 22:24:11
      住院時兒媳全程陪護,出院當天女兒拿來文件:爸,你看看這個

      住院時兒媳全程陪護,出院當天女兒拿來文件:爸,你看看這個

      紙鳶奇譚
      2026-03-31 10:40:50
      網上賣的大流量手機套餐,為啥運營商APP里沒有?

      網上賣的大流量手機套餐,為啥運營商APP里沒有?

      TMT流程審計
      2026-04-11 22:52:18
      國青核心李沂澤年齡存疑引熱議!媒體人:去年有教練跟我說過這事

      國青核心李沂澤年齡存疑引熱議!媒體人:去年有教練跟我說過這事

      狼叔評論
      2026-04-11 23:32:08
      2026-04-12 09:11:00
      酷玩實驗室 incentive-icons
      酷玩實驗室
      關注中國產業升級
      4789文章數 116139關注度
      往期回顧 全部

      科技要聞

      半夜被燃燒瓶砸醒,OpenAI CEO發文反思

      頭條要聞

      男子自帶茅臺就餐飲用時感覺不對味 服務員還"消失"了

      頭條要聞

      男子自帶茅臺就餐飲用時感覺不對味 服務員還"消失"了

      體育要聞

      換帥之后,他們從降級區沖到升級區

      娛樂要聞

      鄭鈞回應兒子走路:會監督他挺直腰板

      財經要聞

      從日本翻身看:這次誰能扛住高油價?

      汽車要聞

      煥新極氪007/007GT上市 限時19.39萬起

      態度原創

      親子
      家居
      教育
      藝術
      軍事航空

      親子要聞

      人為什么會沒有3歲前的記憶呢?

      家居要聞

      復古風格 自然簡約

      教育要聞

      “父親的心已經死了”,10后女孩報到職高,父親全程背對引人心疼

      藝術要聞

      鄭麗文缺席丈夫引爭議!洪秀柱書法爆紅,傳統與現代的碰撞!

      軍事要聞

      伊朗議長帶四名遇難兒童照片赴美伊談判

      無障礙瀏覽 進入關懷版