![](https://cdn.statically.io/img/bucket-image.inkmaginecms.com/version/desktop/1/image/2024/07/589b8b0e-a57c-42e9-be3d-3c364448b007.jpg)
![](https://cdn.statically.io/img/bucket-image.inkmaginecms.com/version/desktop/1/image/2024/07/589b8b0e-a57c-42e9-be3d-3c364448b007.jpg)
拒當免費 AI 訓練資料庫!Cloudflare 推出新工具對抗 AI 爬蟲,85% 網站都選擇封鎖
在人工智慧快速發展的現在,網路創作內容的價值與保護變得愈發重要。近日,全球知名的雲端服務供應商 Cloudflare 宣布推出一項重要措施,���護客戶免受 AI 爬蟲的侵擾。
Cloudflare 於 2024 年 7 月 4 日發布了一款免費工具,專門用於防止 AI 公司的機器人爬取其客戶網站的內容。這項工具的推出背景是近年來 AI 公司大量爬取網路內容用於訓練大型語言模型,引發了廣泛的爭議和關注。
根據 Cloudflare 的內部數據,高達 85.2% 的客戶選擇封鎖 AI 機器人訪問其網站,即使是那些正確識別自身身份的機器人也不例外。這項數據凸顯了內容創作者對 AI 爬蟲的普遍擔憂。
Cloudflare 的研究還揭示了過去一年中最活躍的 AI 爬蟲。其中,字節跳動的 Bytespider 機器人試圖存取 Cloudflare 管轄下 40% 的網站,緊隨其後的是 OpenAI 的 GPTBot,嘗試訪問了 35% 的網站。此外,Amazon 和 Anthropic 的機器人也名列前茅。
面對這種情況,Cloudflare 的新工具將自動更新以識別新出現的惡意機器人,並阻止它們大規模爬取網頁內容。值得注意的是,這項工具將免費提供給所有 Cloudflare 的客戶,包括使用免費方案的用戶。
然而,Cloudflare 也坦言,完全阻止 AI 機器人存取網站內容是一項艱巨的任務。一些 AI 公司為了加快模型訓練速度,可能會繞過或直接違反現有的爬蟲規則。最近,Perplexity AI 就被指控在未獲得許可的情況下爬取網站內容。
儘管如此,Cloudflare 表示將持續改進其機器學習模型,以應對不斷演變的 AI 爬蟲技術。該公司強調其目標是要維護一個讓內容創作者能夠茁壯成長,並完全控制其內容使用方式的網路環境。
Cloudflare 的新措施代表了科技業努力在 AI 發展與內容保護之間尋求平衡。隨著 AI 技術的不斷進步,如何在促進創新與保護知識產權之間取得適當平衡,將繼續成為業界面臨的重要挑戰。
這項新工具的實際效果以及對 AI 模型訓練的影響還有待觀察。但可以確定的是,Cloudflare 的行動代表著內容保護與 AI 發展之間的博弈進入了一個新階段。未來,我們可能會看到更多類似的措施出現,以應對 AI 時代帶來的新挑戰。
資料來源:Claudflare、Engedget
核稿編輯:Sherlock
快加入 INSIDE Google News 按下追蹤,給你最新、最 IN 的科技新聞!
延伸閱讀:
本文初稿由 INSIDE 使用 AI 編撰。