<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

^{<blockquote id="kbm38"></blockquote>}

<blockquote id="kbm38"><rt id="kbm38"></rt></blockquote>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

互聯網上人人遵守的君子協定，正在被AI撕得粉碎！

2026-01-19 08:57:45　來源: 碼農翻身

河南舉報

0

分享至

1993年，互聯網還很小。

我每天早上都會收到一個叫做《what’s new on the web》的郵件，上面會列出所有新出現的網站。

沒錯，是所有的新網站。

我常常一邊喝咖啡，一邊瀏覽這些網站，通常10點鐘之前就能看完。

無聊的時候，我開始自學Perl，嘗試寫網絡爬蟲，這些爬蟲是有用的，比如可以用來做網站目錄，統計文檔數，檢查死鏈，網頁評價大小等等。

在測試的時候，我選擇了一個極為愚蠢的起始URL：一個講網絡爬蟲的知識的網站。

這個網站運行在一家非常小的公司的服務器上，而且只有一條14.4K的專線。（別覺得14.4K很小，我們公司200人，也就租了一個64K的專線）。

我的爬蟲無意間進行了一次拒絕服務攻擊（DoS），把那個網站搞垮了。

負責那個網站的人叫馬丁(Martijn Koster) ，他很生氣，立刻要求我停止那些瘋狂的請求。

馬丁不是一般人，他發明了世界上第一個Web搜索引擎AliWeb。

當他意識到網絡爬蟲可能泛濫的時候，他發明了一套標準的流程：“機器人排除協議”（Robots Exclusion Protocol）。

當你的網絡機器人訪問一個新網站時，需要先去找一個叫 robots.txt 的文件，解析它，然后避開里面列出的目錄或文件。

例如，如果robots.txt長這個樣子：

User-agent: googlebot

Disallow: /private/

它的意思是對于googlebot這個網絡爬蟲，不允許抓取/private這個目錄下的內容。

我覺得我可能寫了第一個遵守 robots.txt 協議的爬蟲，但可以肯定的是，我是那個逼得它被發明出來的蠢蛋。

0 1

君子協定，神奇運行30年

上面的故事來自查爾斯·斯特羅斯 (Charles Stross) 的自述，非常生動地講述了robots.txt被發明的過程。

它并不是一個委員會設計出來的規范，而是早期的互聯網用戶為了解決問題被迫發明的方法。

馬丁只是把這個辦法發到了WWW-Talk的郵件列表中，然后成員們討論robots.txt的基本語言和結構，最后達成一致，所有人都開始支持robots.txt。

它不像TCP/IP，你不支持就無法聯網，它是一個君子協定，是否遵守完全看網絡爬蟲編寫者的意愿。

這有點兒像在你敞開的房間門口立上一塊牌子：禁止入內。

網絡爬蟲/機器人看到了，就真的不進入這個房間了，不管這個房間里有多少寶貝。

讓人驚奇的是，在長達30年的時間內，robots.txt運轉良好。

為什么它能活下來？

在早期，原因只有一個：不守規矩的機器人，會被全網封殺

在那個小圈子里，“流氓機器人”的IP會被拉黑，域名會被公開點名，這是致命的名譽風險。

0 2

最遵守robots.txt的公司贏了

時間很快來到90年代末，互聯網迅猛擴張，海量的網站一個上午絕對是看不完了。

那些藏在世界各地的網站，不通過搜索引擎，無論如何也是找不到的。

于是，搜索引擎和網站之間就robots.txt達成了完美的默契。

網站允許Google爬蟲抓取自己的網頁，這樣它們就可能展示到搜索結果中，給自己帶來巨大的曝光流量。

而Google也嚴格遵循robots.txt的規定，將流量導致其他網站，同時在搜索結果中投放廣告。

這是一次極為成功的價值交換：你讓我爬數據，我給你流量。

雖然robots.txt此時已經成為事實標準，但世界那么大，總有不遵守robots.txt的公司。

尤其是那些信息聚合網站，無視robots.txt的約定，從別人的網站抓取數據（例如新聞，產品信息），聚合后放到自己的網站上。

例如美國的Bidder's Edge（簡稱BE），它建立了一個拍賣信息的聚合網站，專門從包括eBay在內的各個拍賣網站去收集信息，這樣BE的用戶就可以輕松搜索互聯網上的拍賣信息，而無需訪問單獨的拍賣網站。

這eBay肯定不能忍，由于robots.txt是個君子協定，它只好去限制BE爬蟲的IP地址，但是BE通過代理服務器，繞過了IP的限制。

eBay沒辦法，最后一紙訴狀把BE告上了法庭，2000年5月，法院以非法入侵為由，禁止BE以任何自動手段抓取eBay服務器的數據。

0 3

君子協議被撕毀

2017年，一個致力于保存互聯網的網站“互聯網檔案館”，干了一件震動圈子的事情：不再遵守robots.txt。

互聯網檔案館的理由很直接：robots.txt是為了“搜索”設計的，我的目標是保存所有網頁的快照，保存人類的互聯網文明，所以沒必要遵守。

不過這件事兒沒有引起太大波瀾，因為互聯網檔案館是個非盈利的機構，它即使不遵守robots.txt，把所有數據都爬了下來，但依然免費開放，不會拿這些數據去盈利。

但是對于AI公司來說，一切都不一樣了。

如果你開了一家AI公司，嚴格遵守robots.txt，而你的競爭對手通過換UA/IP，偷偷地多抓取一些，結果會如何呢？

你公司的模型由于訓練數據少，自然比不上競爭對手。

用戶會因為你的道德規范高而支持你嗎？不會，他們肯定都跑到競爭對手那里去了。

“如果我守規矩，而對手不守，我就輸了，所以我也不能遵守”。

抓數據其實也沒啥，要命的是流量無法回流到網站了：

（1）網站內容被吸干，流量消失。

（2）AI直接給出答案，用戶再也不會去原來的網站。

（3）內容的創作者，喪失署名權，沒有分成。

所有的網站都感受到脊背發涼：AI不是給我帶來流量的，而是來取代我的。

所以，一定要屏蔽掉那些AI公司的爬蟲！

2023 年，Originality.AI統計發現，在訪問量最高的 1000 個網站中，有 306 個在其 robots.txt 文件中屏蔽了 OpenAI 的 GPTBot，85 個屏蔽了谷歌的 Google-Extended。

BBC 和《紐約時報》等新聞網站普遍禁止訪問 GPTBot。2023 年，博客平臺 Medium 宣布將禁止所有人工智能網絡爬蟲訪問。

OpenAI也擺出了高姿態，說要遵守robots.txt，自家爬蟲的名字就叫GPTBot，它還發布并推廣了一個頁面，“貼心”地教人們如何在robots.txt中屏蔽它。

但是，這一切發生在“強大的底層模型已經訓練完成之后”。

換句話說：“你的模型已經吃飽了，你才開始講禮貌？” 這誰受得了？

robots.txt 是建立在“善意 + 搜索回流”之上的制度，而 AI 打破了這三點。

0 4

尾聲

robots的結構性缺陷，在AI時代徹底暴露。

2025 年，非營利組織 RSL Collective 宣布推出Really Simple Licensing（RSL），對robots.txt進行了一次升級，允許網站發布者在 robots.txt 中明確設置 AI 爬蟲的使用條款，例如：

AI-Commercial: license-required

RSL 標志著 robots.txt 從“爬蟲禮貌手冊”升級成了“產權聲明”，它不阻止AI，而是想讓AI回到一個可以談條件，講規則的世界。

那些巨頭們會不會遵守RSL呢？讓我們拭目以待吧！

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

太狠了！OpenClaw之父一夜屠光5000 Issue，GitHub服務器先跪了

新智元 2026-04-26 11:29:22
42 跟貼 42
谷歌跪了？400億砸向死敵！AI御三家終結，OpenAI孤立無援

新智元 2026-04-25 10:12:04
34 跟貼 34

谷歌亞馬遜同時砸錢養競爭對手，AI時代最荒誕的商業邏輯正在成真

鈦媒體APP 2026-04-26 09:02:10
1 跟貼 1

DeepSeek V4“寄予厚望”！國產算力“進攻的矛”--超節點

華爾街見聞官方 2026-04-26 20:21:15
0 跟貼 0
谷歌400億美金投資Anthropic，算力成AI巨頭資本游戲的砝碼

DeepTech深科技 2026-04-25 21:26:08
8 跟貼 8

谷歌收200美元的AI動態圖表功能，今天被Claude免費開放！

新智元 2026-04-26 18:06:15
0 跟貼 0

今天起，DeepSeek V4成OpenClaw默認模型！

新智元 2026-04-26 11:28:20
3 跟貼 3
谷歌Cloud Next大會焦點：AI Agent邁入規模化，推理芯片成獨立增長曲線

華爾街見聞官方 2026-04-24 11:02:50
0 跟貼 0

參加完百度世界大會，我終于理解了「內化 AI」的正確打開方式

愛范兒 2025-11-13 18:01:50
0 跟貼 0
從“起大早趕大集”到“帶領行業趕大集”：百度引領AI內化時代

每日經濟新聞 2025-11-13 16:41:39
0 跟貼 0
百度沈抖自曝：老忘吃藥，用AI做了個小程序

量子位 2026-03-27 11:25:23
0 跟貼 0
GPT image-2爆火后，設計師的天塌了嗎？

虎嗅APP 2026-04-26 21:02:07
0 跟貼 0
第87屆教裝展直擊丨海亮科技以AI解鎖未來教育

芥末堆看教育 2026-04-26 20:57:19
0 跟貼 0
索尼新規落地！所有數字版游戲都要強制30天聯網驗權

游民星空 2026-04-25 18:12:04
25 跟貼 25
這才是互聯網抽象鼻祖

嘟嘟看劇 2026-04-22 10:29:26
249 跟貼 249
育碧又引眾怒！被迫填寫所在地玩家怒噴竊取隱私

游民星空 2026-04-25 16:36:33
1 跟貼 1
服務器堆疊≠超節點！超節點三大特點打破通信墻

量子位 2026-02-05 08:35:00
0 跟貼 0
有了GEO還有必要做SEO嗎？

鈦媒體APP 2025-10-29 17:49:07
7 跟貼 7
谷歌高管炮轟所有游戲廠家，他們都在用AI做游戲，只是沒人敢承認

新游戲大妹子 2026-04-26 12:51:22
0 跟貼 0
宇樹機器人能駕馭輪滑/冰刀鞋了!

烈焰童子 2026-04-25 11:48:20
0 跟貼 0
如何用豆包學會任何領域？分享幾個小技巧！

林亦LYi 2026-04-24 15:05:28
0 跟貼 0
伊朗內鬼找到了！根本就不是人，美制設備暗藏后門！中國也要當心

村里一枝花人 2026-04-26 04:56:20
0 跟貼 0
早在不明飛行物目擊事件在互聯網上流行之前

趣知小故事 2026-04-22 12:20:47
1 跟貼 1
受中東地區不穩定因素影響!Steam部分地區服務器損壞

游民星空 2026-04-24 15:51:37
0 跟貼 0
京東「再造」京東

機器之心Pro 2026-01-21 18:07:25
0 跟貼 0
美國富豪非洲打獵被5頭大象踩死

看看新聞Knews 2026-04-25 19:38:18
4641 跟貼 4641
電視還有人看嗎？北京周哥與眾不同談看法

紫禁城下的胡同 2026-04-25 06:00:00
33 跟貼 33
「龍蝦之父」吐槽人類互聯網后，終于有人把這當個事兒辦了

機器之心Pro 2026-03-31 11:09:26
0 跟貼 0
百億私募一季度持倉曝光：高毅資產馮柳減持海康威視5700萬股，重陽投資趁機抄底

每日經濟新聞 2026-04-26 20:58:08
1 跟貼 1
這便是機器人，持續發展下去的意義！

烈焰童子 2026-04-24 08:01:30
0 跟貼 0
兩口子帶娃，一個開心一個沮喪

烈焰童子 2026-04-24 08:01:35
0 跟貼 0
《神界》野心太大：出狂言發售日要搞崩Steam！

游民星空 2026-04-25 16:36:33
1 跟貼 1
師門不幸之：我要替師傅清理門戶！

烈焰童子 2026-04-25 11:48:20
0 跟貼 0
中辦、國辦：督促互聯網平臺企業、快遞企業等根據工作任務、勞動強度等合理確定新就業群體勞動報酬，及時足額支付

財聯社 2026-04-26 17:16:12
0 跟貼 0
AI公司開始大量招文科生，微軟谷歌高薪聘文科生

江西都市現場 2026-04-24 22:10:35
0 跟貼 0
早知道做互聯網最賺了

遺忘影視 2026-04-26 11:22:56
0 跟貼 0
買了個新玩意兒，防抑郁焦慮道具+1

烈焰童子 2026-04-25 11:48:19
0 跟貼 0
互聯網的意義在這一刻體現出來了

娛樂課代表孫小寒 2026-04-23 08:53:36
0 跟貼 0
DeepSeek推理分裂出多重人格，越社交越聰明

量子位 2026-02-04 03:32:03
0 跟貼 0
多讀書，少上網，精神營養極度不良

周國平 2026-04-22 17:31:19
0 跟貼 0

1.9秒一單狂破世界紀錄！安徽小縣城憑三樣小吃，火遍整個長三角

1.9秒一單狂破世界紀錄！安徽小縣城憑三樣小吃，火遍整個長三角

青眼財經

2026-04-25 23:05:36

別人對你說“咱倆加個微信”，千萬別說 “您掃我還是我掃您？” 高情商的人這樣做

別人對你說“咱倆加個微信”，千萬別說 “您掃我還是我掃您？” 高情商的人這樣做

德魯克博雅管理

2026-04-23 17:02:27

宇航員登月回歸后精神失常，死前坦言：人類不應踏足遠方

宇航員登月回歸后精神失常，死前坦言：人類不應踏足遠方

清茶淺談

2024-12-20 22:30:46

事態升級，中方軍艦越聚越多，四川艦和遼寧艦匯合，菲日休想鬧事

事態升級，中方軍艦越聚越多，四川艦和遼寧艦匯合，菲日休想鬧事

甜到你心坎

2026-04-25 09:50:11

外貿玩具工廠突發通知：即日起停業破產，上千人飯碗被砸！

外貿玩具工廠突發通知：即日起停業破產，上千人飯碗被砸！

燈錦年

2026-04-26 14:03:21

鄭州一村吃席只有3個菜！煙酒不超40,每桌140,網友：請全國推廣

鄭州一村吃席只有3個菜！煙酒不超40,每桌140,網友：請全國推廣

小秋情感說

2026-04-26 09:35:44

葛斯齊再爆猛料，大S身后事細節太出人意料

葛斯齊再爆猛料，大S身后事細節太出人意料

小椰的奶奶

2026-04-26 20:42:18

港媒：中國正從伊朗的廢墟中汲取關于“持久戰”的冷酷經驗

港媒：中國正從伊朗的廢墟中汲取關于“持久戰”的冷酷經驗

矚望云霄

2026-04-24 23:33:38

4月28日正式開播！中央八套黃金檔好劇來襲！全員演技在線

4月28日正式開播！中央八套黃金檔好劇來襲！全員演技在線

琴琴有氧運動

2026-04-26 14:30:35

上港隊長王燊超：娶了申花球迷，37歲仍征戰中超，恩師盼他回崇明

上港隊長王燊超：娶了申花球迷，37歲仍征戰中超，恩師盼他回崇明

林子說事

2026-04-26 08:49:40

王近山不經請示干掉日本戰地觀戰團，毛主席：早就聽說有個王瘋子

王近山不經請示干掉日本戰地觀戰團，毛主席：早就聽說有個王瘋子

鶴羽說個事

2026-04-20 22:56:36

300965，重大資產重組！明天停牌！

300965，重大資產重組！明天停牌！

證券時報e公司

2026-04-26 17:29:23

商務部新聞發言人就美眾議院外交事務委員會通過MATCH等法案答記者問

商務部新聞發言人就美眾議院外交事務委員會通過MATCH等法案答記者問

新京報

2026-04-25 10:28:06

25-26賽季CBA常規賽最佳陣容出爐

25-26賽季CBA常規賽最佳陣容出爐

刺猬籃球

2026-04-26 18:42:26

首個石油儲備完全枯竭國家出現，比菲律賓慘，還有三個國家很危險

首個石油儲備完全枯竭國家出現，比菲律賓慘，還有三個國家很危險

混沌錄

2026-04-24 21:02:11

恭喜穆里尼奧！有望空降皇馬！權威記者力挺，姆巴佩危險了

恭喜穆里尼奧！有望空降皇馬！權威記者力挺，姆巴佩危險了

阿泰希特

2026-04-26 15:45:41

西媒：西班牙首相稱“不擔心”被逐出北約

西媒：西班牙首相稱“不擔心”被逐出北約

參考消息

2026-04-25 21:19:06

白宮記協晚宴安全事件細節披露

界面新聞

2026-04-26 10:11:44

俄方說破天都沒用，中方就認一個理，中俄天然氣走俄羅斯國內價

俄方說破天都沒用，中方就認一個理，中俄天然氣走俄羅斯國內價

聊歷史的阿稼

2026-04-26 10:25:44

22歲國乒勁敵做出大膽預判！世乒賽奪冠勝算大漲，王皓真得拼一把

22歲國乒勁敵做出大膽預判！世乒賽奪冠勝算大漲，王皓真得拼一把

體話我說

2026-04-26 13:48:21

有趣且硬核的技術文章

257文章數 650關注度

往期回顧全部

科技要聞

漲價浪潮下，DeepSeek推動AI“價格戰”

頭條要聞

特朗普內閣又一女部長落馬:強迫男下屬為其提供性服務

頭條要聞

特朗普內閣又一女部長落馬:強迫男下屬為其提供性服務

體育要聞

森林狼3比1掘金：逆境中殺出了多孫穆？！

娛樂要聞

僅次《指環王》的美劇，有第二季

財經要聞

事關新就業群體，中辦、國辦發文

汽車要聞

預售19.38萬元起哈弗猛龍PLUS七座版亮相

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

親子

家居

手機

房產

軍事航空

親子要聞

今天我們來吃整蠱海盜桶糖果食玩

家居要聞

自然肌理溫潤美學

浪漫協奏法式風格
極簡繪夢克制和諧
詩意光影窺見自然之境

手機要聞

鴻蒙6，玻璃，光，和我

房產要聞

新一輪教育大爆發來了！海口，開始瘋狂建學校！

軍事要聞

伊朗總統：不會在壓力、威脅下進行談判

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：四房播色综合久久婷婷| 亚洲成色www久久网站| 国产av一区二区三区传媒| 师宗县| 国产成人综合日韩亚洲| 日韩欧美在线综合网另类| 久久久综合结合狠狠狠97色| 国产又爽又黄又无遮挡的激情视频| 伊人久久久大香线蕉综合直播| 国产乱码一区二区三区| 变态另类AV| 中文字幕日韩精品无码内射| 日本三级香港三级人妇99| 中文字幕在线人妻视频| 久久久久人妻一区精品性色av| 69老司机精品视频免费观看 | 精品无码av无码免费专区| 色综合久| 在线国产三级| 亚洲国产成人无码av在线影院 | 麻豆aⅴ精品无码一区二区| 国产精品99久久久久久宅男| SHOW| 人妻内射一区二区在线视频 | 中国亚州女人69内射少妇| 久久亚洲精品成人综合| 国产在线精品一区二区不卡麻豆 | 国产美女高潮流白浆视频| 国产精品1区| 亚州精品无码| 亚洲无码网| 综合久久亚洲| 亚洲都市激情| 2021少妇久久久久久久久久| 人人爽人人爽人人片av东京热| 国语偷拍视频一区二区三区| 又黄又无遮挡AAAAA毛片| 国产精品女在线观看| 射死你天天日| 国产96在线 | 欧美| 亚洲中文精品久久久久久不卡|

<blockquote id="scxa4"><p id="scxa4"></p></blockquote>

<tfoot id="scxa4"></tfoot>

<cite id="scxa4"><rp id="scxa4"><form id="scxa4"></form></rp></cite>

^{<blockquote id="scxa4"></blockquote>}