xml格式异常-CDATA嵌套

今天代码解析一段XML时报错,经过检查发现里面有嵌套CDATA标志的情况,导致XML结构发生了变化,不能转换为xml对象了,百度下,找到下面的解决方案,测试下好使,分享下!

http://hi.baidu.com/yin_xiaogang/blog/item/f0f4a4ce3ef0c50592457e78.html

在CDATA内部的所有内容都会被解析器忽略。一个 CDATA 部件以"<![CDATA[" 标记开始,以"]]>"标记结束。但是要记住,CDATA是不能够嵌套的。但是现在,就是有人要求实现CDATA的嵌套。

比如,将下面这段XML加到另外一个XML的某个元素里面:

<?xml version="1.0" encoding="UTF-8" ?>
<System><id>library</id>
<name>Library Management</name>
<description><![CDATA[This is a sample library management subsystem for Signet.]]></description>
<Categories>
<System/>

将内部的CDATA的结尾转义?那就变成了"<![CDATA[" 和"]]>amp;",这样不好吧,老师说,接收XML的那一方怎么会知道你在里面加上了转义?

那么,可以把CDATA的结尾的"]]>"破坏掉,把它分到两个CDATA中,然后调用Java的API读取该元素的数据时,实际上API同时读取两个CDATA块,然后合成一个

那么,把上面的XML作为一个字符串来处理,将"]]>"替换为"]]]]><![CDATA[",千万要记住,不要包含空格进去。这样,结果应该是

<?xml version="1.0" encoding="UTF-8"?>
<Messages>
<Message type="data">
<code>1199242678515-176590595</code>
<date>2008/01/02</date>
<time>10:57:58</time>
<content><![CDATA[<?xml version="1.0" encoding="UTF-8" ?>
<System><id>library</id>
<name>Library Management</name>
<description><![CDATA[This is a sample library management subsystem for Signet.]]]]><![CDATA[></description>
<Categories>
<System/>]]></content>
</Message>

</Messages>

这样,利用Object org.dom4j.Element.getData()方法得到的数据才是原始的XML片段。


CDATA 在xml中使用比较频繁,当我们在给节点的值中有特殊字符时,就需要把值用CDATA括起来,这样就不解析里面的内容了。但是当遇到里面的值中已有CDATA时就出错了。它是不允许嵌套的。今天在使用soapUI时,发现它展示的xml中成功的使用了CDATA嵌套,自己写了个程序试了下,果然管用。
代码如下。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
package test;
import java.io.StringReader;
org.jdom.*;
org.jdom.output.*;
org.jdom.input.*;
/**
*
* @author Administrator
*/
public class CDATATest {
/** Creates a new instance of CDATATest */
public CDATAtest() {
}
static void main(String[] args){
SAXBuilder saxb= new SAXBuilder();
Document doc= null ;
Element element,childelement;
StringReader strreader= ;
Attribute attribute= ;
String xml= "<?xml version=\"1.0\" encoding=\"utf-8\" ?>" +
"<catalogs>" +
"<catalog1>" +
"<![CDATA[<?xml version=\"1.0\" encoding=\"UTF-8\"?><Request><Data><![CDATA[x>0]]]]>><![CDATA[</Data></Request>]]>" +
"</catalog1>" +
"</catalogs>" ; //中间的"]]>"替换成了"]]]]>><![CDATA["
try {
strreader= StringReader(xml);
doc=saxb.build(strreader);
element=doc.getRootElement();
System.out.println( "catalog1的值:" +element.getChildText( "catalog1" ));
} catch (Exception e){
}
}
}

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


php输出xml格式字符串
J2ME Mobile 3D入门教程系列文章之一
XML轻松学习手册
XML入门的常见问题(一)
XML入门的常见问题(三)
XML轻松学习手册(2)XML概念
xml文件介绍及使用
xml编程(一)-xml语法
XML文件结构和基本语法
第2章 包装类
XML入门的常见问题(二)
Java对象的强、软、弱和虚引用
JS解析XML文件和XML字符串详解
java中枚举的详细使用介绍
了解Xml格式
XML入门的常见问题(四)
深入SQLite多线程的使用总结详解
PlayFramework完整实现一个APP(一)
XML和YAML的使用方法
XML轻松学习总节篇