简单使用SAXReader解析xml数据和outputformat 输出格式化xml

简单的学习一下xml,在w3school上看看就可以了:

http://www.w3school.com.cn/xml/index.asp

看一下xml和Json之间的对比和差别,这篇博客写的还是很详细的:

http://www.cnblogs.com/SanMaoSpace/p/3139186.html

知乎的这个问题也不错,学习学习涨姿势:

https://www.zhihu.com/question/25636060

下面就说说怎么使用SAXReader来解析xml格式的数据吧。

首先当然是要导入dom4j的jar包了。我们来造一个测试用的xml文档,好像一般入门的测试数据都是这个book.xml,我们也拿这个来简单学习一下吧。

book.xml数据如下:

<books>
<book>
<author>Thomas</author>
<title>Java从入门到放弃</title>
<publisher>UCCU</publisher>
</book>
<book>
<author>小白</author>
<title>MysqL从删库到跑路</title>
<publisher>GoDie</publisher>
</book>
<book>
<author>PHPer</author>
<title>BestPHP</title>
<publisher>PHPchurch</publisher>
</book>
</books>

把book.xml放在D盘的根目录下,这样读取时能比较方便些……

下面是代码

package com;  
  
import org.dom4j.Document;  
import org.dom4j.Element;  
import org.dom4j.io.SAXReader;  
  
import java.io.ByteArrayInputStream;  
import java.io.File;  
import java.util.List;  
  
public class SAXReaderXML {  
    public static void main(String[] args) throws Exception {  
        SAXReader reader = new SAXReader();  
        File xmlfile = new File("D:/books.xml");  
        String xml = "<books><book><author>Thomas</author><title>Java从入门到放弃</title><publisher>UCCU</publisher></book><book><author>小白</author><title>MysqL从删库到跑路</title><publisher>GoDie</publisher></book><book><author>PHPer</author><title>BestPHP</title><publisher>PHPchurch</publisher></book></books>";  
        Document fileDocument = reader.read(xmlfile);//从xml文件获取数据  
        Document document = reader.read(new ByteArrayInputStream(xml.getBytes("utf-8")));//读取xml字符串,注意这里要转成输入流  
        Element root = document.getRootElement();//获取根元素  
        List<Element> childElements = root.elements();//获取当前元素下的全部子元素  
  
        for (Element child : childElements) {//循环输出全部book的相关信息  
            List<Element> books = child.elements();  
            for (Element book : books) {  
                String name = book.getName();//获取当前元素名  
                String text = book.getText();//获取当前元素值  
                System.out.println(name + ":" + text);  
            }  
        }  
        //获取第二条书籍的信息  
        Element book2 = childElements.get(1);  
        Element author = book2.element("author");//根据元素名获取子元素  
        Element title = book2.element("title");  
        Element publisher = book2.element("publisher");  
        System.out.println("作者:" + author.getText());//获取元素值  
        System.out.println("书名:" + title.getText());  
        System.out.println("出版社:"+publisher.getText());  
    }  
}

代码解析:

1、读取xml数据

SAXReader可以通过多种方式读取xml数据,并返回Document格式的对象。通过查看源码,可以看出read()方法接收File,InputStream和URL等格式的参数来读取相应的xml数据。在代码里我演示了读取xml文档和xml格式的字符串两种方式。当然,字符串要根据相应的编码转成输入流才能被SAXReader读取。

2、解析xml数据

读取到Document对象后,我们使用getRootElement()方法获取根元素,返回的是一个Element对象。在本例中,该元素的name即为books。

3、获取子元素数据

获取根元素后,便可以一层一层的去获取他的子元素信息。如果知道子元素的标签名称,便可以直接调用element("name")方法获取该子元素。如果不知道子元素的名称,或者想直接获取该元素下的全部子元素,可以调用elements()方法获取一个包括全部元素的list,然后进行下一步的处理。

4、输出元素信息

调用getName()方法获取当前元素的元素名,attributeValue()获取属性名。如果当前元素没有子元素,则调用getText()方法获取元素值

xml格式化

代码:

package com.ddatsh;
 
import java.io.IOException;
import java.io.StringReader;
import java.io.StringWriter;
import java.io.UnsupportedEncodingException;
 
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.SAXReader;
import org.dom4j.io.XMLWriter;
 
public class XmlFormat {
 
    public static String format(String str) throws Exception {
        SAXReader reader = new SAXReader();
        // System.out.println(reader);
        // 注释:创建一个串的字符输入流
        StringReader in = new StringReader(str);
        Document doc = reader.read(in);
        // System.out.println(doc.getRootElement());
        // 注释:使用OutputFormat创建格式化输出
        OutputFormat formater = OutputFormat.createPrettyPrint();
        //formater=OutputFormat.createCompactFormat();
        // 注释:设置xml的输出编码
        formater.setEncoding("utf-8");
        // 注释:创建输出(目标)
        StringWriter out = new StringWriter();
        // 注释:创建输出流
        XMLWriter writer = new XMLWriter(out,formater);
        // 注释:输出格式化的串到目标中,执行后。格式化后的串保存在out中。
        writer.write(doc);
 
        writer.close();
        System.out.println(out.toString());
        // 注释:返回我们格式化后的结果
        return out.toString();
    }
 
    public static void main(String[] args) throws Exception {
        String head="<?xml version=\"1.0\" encoding=\"GBK\"?>";
        String str = "<books><book><author>Thomas</author><title>Java从入门到放弃</title><publisher>UCCU</publisher></book><book><author>小白</author><title>MysqL从删库到跑路</title><publisher>GoDie</publisher></book><book><author>PHPer</author><title>BestPHP</title><publisher>PHPchurch</publisher></book></books>";
        // System.out.println(str);
        format(str);
    }
}

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


php输出xml格式字符串
J2ME Mobile 3D入门教程系列文章之一
XML轻松学习手册
XML入门的常见问题(一)
XML入门的常见问题(三)
XML轻松学习手册(2)XML概念
xml文件介绍及使用
xml编程(一)-xml语法
XML文件结构和基本语法
第2章 包装类
XML入门的常见问题(二)
Java对象的强、软、弱和虚引用
JS解析XML文件和XML字符串详解
java中枚举的详细使用介绍
了解Xml格式
XML入门的常见问题(四)
深入SQLite多线程的使用总结详解
PlayFramework完整实现一个APP(一)
XML和YAML的使用方法
XML轻松学习总节篇