如何解决JSoup 没有从带有锚点的 URL 读取内容
我正在使用 JSoup 从以下页面读取内容:
https://www.astrology.com/horoscope/daily/aries.html#Monday
这是我正在使用的代码:
String test1 = "https://www.astrology.com/horoscope/daily/aries.html#Monday";
String test2 = "https://www.astrology.com/horoscope/daily/aries.html#Tuesday";
Document document = Jsoup.connect(test1).get();
Element content = document.getElementById("content");
Element p = content.child(0);
String myTest = p.text();
在 URL 中,我可以使用锚点度过一天(参见 test1
和 test2
变量),但在这两种情况下,它返回相同的内容,看起来 JSoup 只是忽略了锚点,只是使用基本 URL:https://www.astrology.com/horoscope/daily/aries.html
。有没有办法让 JSoup 读取带有锚点的 URL?
解决方法
Jsoup 忽略了锚点,因为相关信息是用 JavaScript 渲染的,Jsoup 无法处理它。如果您使用浏览器的开发工具检查页面,您会发现每日信息位于 json 文件中,例如 https://www.astrology.com/horoscope/daily/all/aries/2021-03-23/,因此您可以轻松更改日期/符号并获得您喜欢的任何内容。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。