如何解决模拟登录以在登录墙后面抓取数据的最简单方法
我正在尝试从 Yahoo Finance 中抓取数据。我需要的数据只能通过我购买的高级订阅访问。然而,每当我运行我的脚本来抓取网页时,它都是在我的登录之外完成的。因此我的脚本返回 -
{"finance":{"result":nullerror:{"code":"unauthorized"description:"用户未登录"}}}
我想模拟我通过 python 登录雅虎财经,以便我可以抓取它的高级数据。有什么提示吗?
This is what the login looks like. It has two steps.
解决方法
您可以尝试一个名为 yahooquery 的包。通过该界面可以获得许多高级数据。免责声明:我是包的作者。
另外,如果你仍然想自己做,你可以浏览 GitHub 上的 source code,看看我是如何使用 Selenium 登录的。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。