使用 CloudFlare 后百度抓取诊断抓取失败的解决办法。
很多站长都在向明月反应网站接入全部 CloudFlare 后百度爬虫抓取失败很严重,哪怕是规则和 IP 里都向百度爬虫开放依旧会抓取失败,无论是 PC 端还是移动端都是如此,理论上来说 CloudFlare 强大又灵活的软防实力和大数据基础是不应该出现这类问题的,毕竟谷歌、必应等境外爬虫就从来没有出现过这个问题。
在百度站长平台【抓取诊断】里无论是 PC 抓取还是移动端抓取都是报“socket 读写错误”
可以在 CloudFlare【安全性】事件里看到百度爬虫已经正常来访抓取了
意外的头条搜索爬虫竟然也来了
比较意外的是在 CloudFlare 后台【安全性】的事件里竟然除了百度爬虫外,还发现了头条搜索爬虫和搜狗爬虫、神马搜索爬虫竟然也都恢复了抓取,看来国内搜索引擎爬虫对 SSL 的支持支持还是很有限呀,稍微高端点儿的竟然就不支持了,草率的报个“Socket 错误”就给应付了,好坑爹呀!
本文转自明月登楼的博客
共有 0 条评论