微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

使用 python 对 Web 进行转义后出现“406 Not Acceptable”

如何解决使用 python 对 Web 进行转义后出现“406 Not Acceptable”

删除的网站通过在浏览器上显示 406 Not Acceptable 来阻止我。可能我错误地在 phython 代码上一次发送了太多请求。

所以我为每个循环添加time.sleep(10) 以使其看起来不像是 DDoS 攻击,而且它似乎成功了。

我的问题是:

  1. 在每个请求之间发送多长时间是合理的?每个循环休眠 10 秒使我的代码运行速度过慢。

  2. 如何修复我的浏览器上的 406 Not Acceptable 错误?他们仍然将我拒之门外,除非我碰巧使用了我的 IP 地址,但这不是永久的解决方案。

感谢大家的回答和评论。美好的一天!

解决方法

任何速率限制错误都取决于您选择抓取/与之交互的网站。我可以建立一个网站,只允许您每天查看一次,然后在屏幕上抛出 HTTP 错误。所以要回答你的第一个问题,没有明确的答案。您必须自己测试一下,看看您能达到的最快速度是多少,而不会被阻止。

但是,有一个解决方法。如果您使用代理,则几乎不可能检测到并停止执行请求,因此您不会受到任何 HTTP 错误的影响。 但是,仅仅因为您可以,并不意味着您应该-我是一名程序员,而不是一名律师。我敢肯定,某处有一条规则规定,向网页发送垃圾邮件,即使在它告诉您停止之后,也是非法的。

您的第二个问题与编程并不完全相关,但无论如何我都会回答-尝试清除 cookie 或刷新 IP(尝试使用 VPN 等)。除了更改您的 IP 或 cookie 之外,页面可以通过指纹识别您的方式(以阻止您)的方式并不多。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。