如何解决如何在不影响大小写和换行的情况下获得实际的源代码?
我正在使用 jsoup 来获取源代码。我正在使用 jsoup 版本 1.13.1。当我使用以下代码获取源代码时,我发现大小写已转换为小写。
Document doc = Jsoup.connect("https://example.com").get();
webview.loadData(doc);
我看到了几个他们更喜欢 xml 解析器的答案。但我不知道如何使用 xml 解析器从 url 解析 html。还有我不明白的基本网址。我正在处理一个 Android 应用程序项目。所以任何答案都会对我有帮助。提前致谢
解决方法
使用与默认解析器不同的解析器很容易 - XML 解析器(保留大小写并禁用漂亮打印(即保留换行符))或类似配置的 HTML 解析器。只需使用 Connection#parser() 方法:
Document document = Jsoup.connect("https://example.com")
.parser(Parser.xmlParser())
.get();
Document document = Jsoup.connect("https://example.com")
.parser(Parser.htmlParser().settings(ParseSettings.preserveCase))
.get();
document.outputSettings().prettyPrint(false);
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。