防止HtmlUnit 2.13执行JavaScript

这是我的代码获取页面:
WebClient webClient = new WebClient();
HtmlPage page = webClient.getPage(url);

问题是webClient总是自动执行javascript,并给我一个错误列表.我只想得到原始来源.如何防止它执行脚本?我发现在版本2.9中有一种方法:

webClient.setJavaScriptEnabled(false);

但是不建议使用setJavaScriptEnabled()函数.有谁知道如何解决这个问题?请帮帮我.非常感谢.

解决方法

尽管setJavaScriptEnabled(boolean)已被弃用,但已添加到WebClient的WebClientOptions成员.这是 doc.

为了禁用JavaScript,您应该这样做:

webClient.getOptions().setJavaScriptEnabled(false);

另外,如果你想从网页上获取原始的HTML代码,你应该看看这个问题:

How to get the pure HTML of a page with HTMLUnit while ignoring scripts and other contents

考虑到即使是asXml()方法也可以更改格式以及您获取的网页的内容(即使JavaScript被禁用).

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


html5中section的用法
span标签和p标签的区别
jsp文件和html文件的区别是什么
span标签和div的区别
html颜色代码表大全
span标签的作用是什么
dhtml的主要组成部分包括什么
html编辑器哪个软件好用
span标签属于什么样式标签
html文件乱码怎么办
html怎么读取json文件
html文件打开乱码怎么恢复原状
html怎么链接外部css
html文件怎么保存到本地
html怎么链接css文件
html和css怎么连接
html和css怎么关联
html文件怎么保存到一个站点
html文件怎么写
html出现乱码怎么解决