我正在使用一个名为Jsoup的HTML解析器来加载和解析HTML文件.问题是我正在抓取的网页是用ISO-8859-1字符集编码的,而Android使用的是UTF-8编码(?).这导致一些字符显示为问号.
所以现在我想我应该将字符串转换为UTF-8格式.
现在我在Android SDK中找到了这个名为CharsetEncoder的类,我想这可以帮助我.但我无法弄清楚如何在实践中实现它,所以我想知道是否可以通过一个实际的例子得到som的帮助.
更新:读取数据的代码(Jsoup)
url = new URL("http://www.example.com");
Document doc = Jsoup.parse(url,4000);
最佳答案
您可以让Android为您完成工作,方法是将页面读入byte [],然后使用jSoup方法解析String对象.
当您使用正确的String constructor从服务器读取的数据创建字符串时,请不要忘记指定编码.
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。