如何解决无法在 HTML 中购买表格
我是第一次来。我可以解析表。 需要班级 table_offers_day 中的所有 Childs。
但我的鳕鱼什么也没给我。
Document document = Jsoup.parse(new URL("https://www.ittour.com.ua"),3000); Elements elements = document.getElementsByClass("table_offers_day");
System.out.println(elements.text());
解决方法
该内容不在源中 -- 内容是通过 javascript ajax 调用加载的。 jsoup 是一个 HTML 解析器,不执行 javascript。您可以使用浏览器的查看源与检查快速检查此类内容。查看源代码显示服务器提供的原始 HTML 以及 jsoup 可以看到的内容。 Inspect 是浏览器解析后的 DOM,远程获取内容并将其添加到 DOM 等...
如果您使用检查、查看网络并重新加载,您将看到用于获取该内容的 json 调用。你大概可以这样简单地获取它。
我认为这种方法(结合用于 HTML 的 jsoup 和例如用于 json 解码的 gson)效果很好,并且比运行完整的无头浏览器更有效,因为这将使用更多的网络、内存和 CPU。但是,设置它可能需要更多的工作,所以这是一个需要审查的权衡。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。