如何解决Jsoup connectURL获取编码
使用Jsoup连接到URL时遇到一些问题,我无法设置HTML的编码,标记中的文本仅显示为“?”。我已经在论坛和文档中进行了详尽的搜索,但是我无法提出任何可行的解决方案。
这是运行Jsoup connect时出现问题的HTML部分之一
运行连接时的结果是:
如果我尝试使用解析器,则会收到以下消息:“请启用JavaScript以查看页面内容”
如在stackoverflow中的某些线程中所述,我更改了输出编码以检查问题是否出在此,但结果是相同的。我尝试将内容保存到正确的iso中的文件中,但效果不佳,并带有问号。
我正在使用的代码段非常简单,因为我只是尝试获取HTML:
Document doc = Jsoup.connect(a)
.header("Content-Type","application/x-www-form-urlencoded")
.postDataCharset("ISO-8859-1") // tried other encodings but no success as well,same output
.get();
System.out.println(doc);
在使用Jsoup的 connect()。get()之前,有人遇到过这个问题吗?
更新
使用其他网站不会出现此问题:
String a = "https://flatschart.com/html5/descricao.html";
Document doc = Jsoup.connect(a)
.header("Content-Type","application/x-www-form-urlencoded")
.postDataCharset("ISO-8859-1")
.get();
System.out.println(doc);
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。