微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

动态网站抓取不选择 C# 中的项目

如何解决动态网站抓取不选择 C# 中的项目

我想对以下网页进行网站抓取。但是,像 selenium 和 puppeteersharp 这样的动态网站抓取库不会选择此页面表格中显示的项目(见图)。

https://www2.asx.com.au/markets/trade-our-cash-market/todays-announcements

以上库都没有在 Headline 列下列出 hrefs,尽管如果我尝试保存此页面的屏幕截图,我可以看到很少的表格行。

解决此问题的最佳方法是什么?

为什么这些完善的库在此页面上不起作用?

enter image description here

解决方法

您在此处尝试抓取的内容位于 iframe 内。
要访问它,您必须切换到该 iframe。
请参阅 here 示例如何使用 BeautifulSoup 切换到 iframe。
Here 在 iframe 中使用 Selenium 抓取的示例。
还有 here 和 puppeteersharp

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。