我正在读一个包含德语,法语,西班牙语,英语和波兰文的xml文件.
为了处理抛光字母(这导致最麻烦)我试图这样做:
File file = new File(path); InputStream is = new FileInputStream(file); Reader reader = new InputStreamReader(is,charset); InputSource src = new InputSource(reader); src.setEncoding(charset.name()); SAXParserFactory factory = SAXParserFactory.newInstance(); SAXParser saxParser = factory.newSAXParser(); saxParser.parse(src,handler);
我遇到的问题是没有任何默认的字符集正确显示文本.一些有问号,其中一些有其他字符的组合,例如AO ..
为了打破它,我写了另一个片段来测试哪个charset工作:
public static void main(String[] args){ Charset charset = StandardCharsets.UTF_8; String chars = "śłuna długie"; System.out.println(new String(chars.getBytes(charset),charset)); }
再次测试每一个但没有任何作用..
我希望你有个主意.
解决方法
原文地址:https://www.jb51.cc/java/129172.html
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。