如何解决Captcha是否已完全使我的Selenium脚本无效?
我有一个用Python / Selenium编写的网络爬虫,每天早上都会自动为我在体育馆保留一个位置(您必须在上午7点保留,而且它们很快就会填满,所以我每天将其自动运行到每天7点)。对于我来说,它一直运行良好,但是几天前它停止了工作。因此,我提早起床并检查了发生的情况-发现该体育馆已将Captcha添加到其预订流程中。
这是否意味着在网站上工作的人向其添加了验证码?还是添加了Google?无论如何,我会被搞砸吗?我的机器人有办法绕过验证码吗?
我发现,当我运行Selenium脚本时,验证码需要附加步骤(即找到所有的人行横道),而当我尝试手动保留验证码时,验证码仍在那儿,但只需要在继续操作之前单击它即可。这是我可以利用的东西吗?
在此先感谢您的帮助。
解决方法
我以前也遇到过类似的问题。有时,您只是被困住而无法超越。毕竟,这正是Captcha要完成的任务。
但是,我发现有时该网站仅在根据您的行为怀疑您是机器人时才向您提供验证码。这可以部分克服,特别是如果您只是偶尔打个电话,可以使您的漫游器难以预测。我使用np.random
执行此操作。我使用Poisson分布在单个会话的上下文中模拟用户操作,因为操作之间的时间通常是Poisson分布。而且,我可以通过简单地随机选择某个范围内的时间来随机化登录网站的时间。这些简单的操作非常有效,尽管最终大多数网站都会弄清楚您在做什么。
但是,在实施这两种解决方案之前,我强烈建议您阅读该网站的使用条款,并考虑是否克服其验证码是违法的。如果您与他们签署了使用协议,即使这样做有些不便,正确的做法就是兑现该协议。我认为,这个单独的道德决定比试图绕过他们的验证码的技术挑战更为重要。
,尝试使用https://github.com/dessant/buster解决验证码
在python硒中的实现-> repository
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。