中小网站建议屏蔽DataForSeoBot爬虫。

ivye • 2024年 11月 27日 22:01 • 免费干货 • 144 阅读

文章目录[隐藏]

近期通过日志分析发现DataForSeoBot爬虫最近大量抓取数据，且频次非常高，极大消耗服务器资源。它究竟是个什么来头？

DataForSeoBot爬虫是什么

许多人会将 DataForSEO Link Bot 视作另一个搜索引擎的网络爬虫。其实不然。

DataForSEO 是通过向世界各地的 SEO 爱好者和专业人士提供高质量的数据来创造公平的竞争环境。

换句话说，就是DataForSeoBot爬虫采集的数据是提供给众多SEO从业人士的，这些数据可以被用作SEO竞争分析、SEO软件开发、市场调查、甚至网络推广等方面。也就是说，对于被抓取的网站本身来说，无任何价值，甚至有数据被采集的负面影响。

官网宣称DataForSeoBot爬虫支持robots.txt协议，但在百度搜索中发现，有站长吐槽它不太守规矩。所以建议通过同时使用以下两种方式来禁止它。

User-agent: DataForSeoBot
Disallow: /

Nginx禁止DataForSeoBot爬虫规则如下：

if ($http_user_agent ~ "DataForSeoBot/1.0" )
{
      return 403;
}

另外还可以通过禁止IP访问权限的方式，但IP地址可能会变更，所以不推荐封禁IP。

文章版权归原作者所有或来自互联网，未经允许请勿转载。如有侵权请联系我删除，谢谢！

THE END

二维码

打赏

一为（OneNav）主题添加离线 Font Awesome 字体方法

下一篇>>

文章目录

关闭