java – Sax解析和编码

我有一个联系人在解析RSS和Atom文件时遇到SAX问题.根据他的说法,就好像来自Item元素的文本被截断为撇号或有时是重音字符.编码似乎也有问题.

我已经尝试过SAX了,我也有一些截断,但是还没有进一步挖掘.如果有人在此之前解决了这个问题,我会很感激.

这是在ContentHandler中使用的代码

public void characters( char[],int start,int end ) throws SAXException {
//
    link = new String(ch,start,end);

编辑:编码问题可能是由于将信息存储在字节数组中,因为我知道Java在Unicode中工作.

解决方法

不保证characters()方法在一次传递中为您提供文本元素的完整字符内容 – 全文可能跨越缓冲区边界.您需要在开始和结束元素事件之间自己缓冲字符.

例如

StringBuilder builder;

public void startElement(String uri,String localName,String qName,Attributes atts) {
   builder = new StringBuilder();
}

public void characters(char[] ch,int length) {
   builder.append(ch,length);
}

public void endElement(String uri,String qName) {
  String theFullText = builder.toString();
}

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


应用场景 C端用户提交工单、工单创建完成之后、会发布一条工单创建完成的消息事件(异步消息)、MQ消费者收到消息之后、会通知各处理器处理该消息、各处理器处理完后都会发布一条将该工单写入搜索引擎的消息、最终该工单出现在搜索引擎、被工单处理人检索和处理。 事故异常体现 1、异常体现 从工单的流转记录发现、
线程类,设置有一个公共资源 package cn.org.chris.concurrent; import java.util.concurrent.locks.Lock; import java.util.concurrent.locks.ReentrantLock; /** * @Descrip
Java中的数字(带有0前缀和字符串)
在Java 9中使用JLink的目的是什么?
Java Stream API Filter(过滤器)
在Java中找到正数和负数数组元素的数量
Java 9中JShell中的不同启动脚本是什么?
使用Java的位填充错误检测技术
java中string是什么
如何使用Java中的JSON-lib API将Map转换为JSON对象?
Java菜单驱动程序以检查数字类型
使用Junit的Maven项目 - 检查银行账号
JAVA编程基础
在Java中使用throw、catch和instanceof来处理异常
在Java中,将数组分割为基于给定查询的子数组后,找到子数组的最大子数组和
如何在Java中从给定的字符串中删除HTML标签?
在PHP中,IntlChar getBlockCode()函数的翻译如下:
如何在Android中实现按下返回键再次退出的功能?
如何使用Java中的流式API解析JSON字符串?
Java中的模式类