这是我的代码获取页面:
WebClient webClient = new WebClient(); HtmlPage page = webClient.getPage(url);
问题是webClient总是自动执行javascript,并给我一个错误列表.我只想得到原始来源.如何防止它执行脚本?我发现在版本2.9中有一种方法:
webClient.setJavaScriptEnabled(false);
但是不建议使用setJavaScriptEnabled()函数.有谁知道如何解决这个问题?请帮帮我.非常感谢.
解决方法
尽管setJavaScriptEnabled(boolean)已被弃用,但已添加到WebClient的WebClientOptions成员.这是
doc.
为了禁用JavaScript,您应该这样做:
webClient.getOptions().setJavaScriptEnabled(false);
另外,如果你想从网页上获取原始的HTML代码,你应该看看这个问题:
How to get the pure HTML of a page with HTMLUnit while ignoring scripts and other contents
考虑到即使是asXml()方法也可以更改格式以及您获取的网页的内容(即使JavaScript被禁用).
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。