秘密客 shares
2 weeks ago
這個應該也算是一種蜜罐嗎
---
該網站包含數十億個單頁的網站,所有網站相互連接。每個頁面看起來幾乎相同,但每當有人點擊連結,網站的內容就會稍微改變一下。萊文使用一個簡單的程式創建了一個系統,每次點擊都會從儲存在資料庫中的一組名字中產生一個新的頁面名稱。

萊文的網站設計很容易誘捕網頁爬蟲,這些爬蟲是設計用來掃描網際網路的程式。例如,OpenAI 的機器人就因此陷入這個循環當中,以至於在一天內幾乎每秒存取該網站150次。OpenAI 的爬蟲被設計癱瘓,卡在「世界上最無聊的內容農場」上無法脫身
John Smith
2 weeks ago
我記得以前寫過只要爬蟲來,就會產生源源不絕的email (LOL)
立即下載