TinyXml 优秀的开源 xml 解析器

TinyXml 优秀的开源 xml 解析器 2010-08-11 11:10:04

分类：C/C++

读取和设置xml配置文件是最常用的操作，试用了几个C++的XML解析器，个人感觉TinyXML是使用起来最舒服的，因为它的API接口和Java的十分类似，面向对象性很好。

TinyXML是一个开源的解析XML的解析库，能够用于C++，能够在Windows或Linux中编译。这个解析库的模型通过解析XML文件，然后在内存中生成DOM模型，从而让我们很方便的遍历这棵XML树。

DOM模型即文档对象模型，是将整个文档分成多个元素（如书、章、节、段等），并利用树型结构表示这些元素之间的顺序关系以及嵌套包含关系。

如下是一个XML片段：

代码链接：TinyXml.zip

<Persons>
<Person ID="1"<name>周星星</name<age>20/age/Person"2">白晶晶>18/Persons>

在TinyXML中，根据XML的各种元素来定义了一些类：

tixmlBase：整个TinyXML模型的基类。

tixmlAttribute：对应于XML中的元素的属性。

tixmlNode：对应于DOM结构中的节点。

tixmlComment：对应于XML中的注释

tixmlDeclaration：对应于XML中的申明部分，即<？versiong="1.0"?>。

tixmlDocument：对应于XML的整个文档。

tixmlElement：对应于XML的元素。

tixmlText：对应于XML的文字部分

tixmlUnkNown：对应于XML的未知部分。

tixmlHandler：定义了针对XML的一些操作。

TinyXML是个解析库，主要由DOM模型类（tixmlBase、tixmlNode、tixmlAttribute、tixmlComment、tixmlDeclaration、tixmlElement、tixmlText、tixmlUnkNown）和操作类（tixmlHandler）构成。它由两个头文件（.h文件）和四个CPP文件（.cpp文件）构成，用的时候，只要将（tinyxml.h、tinystr.h、tinystr.cpp、tinyxml.cpp、tinyxmlerror.cpp、tinyxmlparser.cpp）导入工程就可以用它的东西了。如果需要，可以将它做成自己的DLL来调用。举个例子就可以说明一切。。。

对应的XML文件：

>phinecos>22>

读写XML文件的程序代码：

#include<iostream>
#include"tinyxml.h"
#include"tinystr.h"
#include<string>
#include<windows.h<atlstr>
using namespace std;

CString GetAppPath()
{//获取应用程序根目录
TCHAR modulePath[MAX_PATH];
GetmodulefileName(NULL,modulePath);
CString strModulePath(modulePath;
strModulePath=strModulePath.Left(strModulePath.ReverseFind(_T('\\';
return strModulePath;
}

/创建XML 文件文件保存的路径否则false
bool CreateXmlFile(string&szFileName{
try
{
/创建一个XML的文档对象。
tixmlDocument*myDocument=newtixmlDocument/创建一个根元素并连接。
tixmlElement*RootElement=newtixmlElement"Persons";
myDocument->LinkEndChild(RootElement;

/创建一个Person元素并连接。
tixmlElement*PersonElement=new tixmlElement"Person";
RootElement->LinkEndChild(PersonElement/设置Person元素的属性。
PersonElement->SetAttribute"ID"/创建name元素、age元素并连接。
tixmlElement*NameElement"name";
tixmlElement*AgeElement"age";
PersonElement-(NameElement(AgeElement/设置name元素和age元素的内容并连接。
tixmlText*NameContent=new tixmlText"周星星";
tixmlText*AgeContent"22";
NameElement-(NameContent;
AgeElement-(AgeContent;
CString appPath=GetAppPath;
string seperator"\\";
string fullPath=appPath.GetBuffer(0+seperator+szFileName>SaveFile(fullPath.c_str;/保存到文件
}
catch&e{
return false}
return true/读取Xml文件，并遍历
bool readxmlFile{
CString appPath/创建一个XML的文档对象。
tixmlDocument=new tixmlDocument>LoadFile/获得根元素，即Persons。
tixmlElement=myDocument->RootElement/输出根元素名称，即输出Persons。
cout<RootElement->Value<endl/获得第一个Person节点。
tixmlElement*FirstPerson=RootElement->FirstChildElement/获得第一个Person的name节点和age节点和ID属性。
tixmlElement=FirstPerson->FirstChildElement;// 结点
tixmlElement=NameElement->NextSiblingElement;//结点
tixmlAttribute*IDAttribute>FirstAttribute;// 属性
/输出第一个Person的name内容，即周星星；age内容，即；ID属性，即。
cout<NameElement->FirstChild-;
cout<AgeElement-<IDAttribute-}
int main{
string fileName"info.xml";
CreateXmlFile(fileName;
readxmlFile}

官方下载地址：https://www.jb51.cc/tinyxml

本地下载地址：http://blogimg.chinaunix.net/blog/upfile2/100811111318.zip

在TinyXML中，根据XML的各种元素来定义了一些类：
tixmlBase：整个TinyXML模型的基类。
tixmlAttribute：对应于XML中的元素的属性。
tixmlNode：对应于DOM结构中的节点。
tixmlComment：对应于XML中的注释。
tixmlDeclaration：对应于XML中的申明部分，即<？versiong="1.0" ?>。
tixmlDocument：对应于XML的整个文档。
tixmlElement：对应于XML的元素。
tixmlText：对应于XML的文字部分。
tixmlUnkNown：对应于XML的未知部分。
tixmlHandler：定义了针对XML的一些操作。

例如:

?xmlversion"1.0"standalone=no<!– Our to do list data –<Todo<Item priority>Go to the<bold>Toy store!/bold>/Item>Do bills/Todo>

整个对象树：

tixmlDocument "demo.xml"
tixmlDeclaration "version=’1.0′" "standalone=no"
tixmlComment " Our to do list data"
tixmlElement "Todo"
tixmlElement "Item" Attribtutes: priority = 1
tixmlText "Go to the "
tixmlElement "bold"
tixmlText "Toy store!"
tixmlElement "Item" Attributes: priority=2
tixmlText "Do bills"

在tinyXML中,用FirstChild（"名字"）查找节点时,调用FirstChild函数的节点与要查找的节点必须成“父子关系”。

句柄

想要健壮地读取一个XML文档，检查方法调用后的返回值是否为null是很重要的。一种安全的检错实现可能会产生像这样的代码：

tixmlElement*root=document.FirstChildElement"Document"if(root{
tixmlElement*element=root"Element"(element*child=element"Child"(child*child2=child>NextSiblingElement(child2{
// Finally do something useful.

用句柄的话就不会这么冗长了，使用tixmlHandle类，前面的代码就会变成这样：

tixmlHandle docHandle&document=docHandle.FirstChild.Child.toElement// do something useful

一、读取XML,设置节点文本
如下XML片段:

"1.0"encoding"UTF-8"standalone"yes"?<ZXML<ZAPP<VBS_RUNTIME_ParaMS<broADCAST_VERSION info"版本">8/broADCAST_VERSION<broadcast<FileCount info"资源文件个数">69/FileCount<SOURCE_1<ID info"图片编号">1/ID<Versioninfo"图片版本"/Version<Path info"图片路径"/mnt/share/1.bmp/Path<FileMode info"文件处理模式">0/FileMode/SOURCE_1<SOURCE_2/2>2/SOURCE_2.
/broadcast/VBS_RUNTIME_ParaMS/ZAPP/ZXML>

要设置broADCAST_VERSION节点的值 8为其他值,可参考如下代码(将值加1):
用ReplaceChild( tixmlNode* replaceThis,const tixmlNode& withThis )方法替换

tixmlDocument doc"zapp.conf";
doc.LoadFile;
tixmlHandle docHandle&doc*broadcast_ver"ZXML""ZAPP""VBS_RUNTIME_ParaMS""broADCAST_VERSION";
tixmlNode*oldnode=broadcast_verconstchar*ver>GetTextintoldVeratoi(ver;
CString newVer;
newVer.Format"%d"+1;
tixmlText newText(newVer;
broadcast_ver>ReplaceChild(oldnode;
AfxMessageBox(broadcast_ver;//输出值

doc.SaveFile;

二,删除节点,属性值

RemoveChild( tixmlNode* removeThis )方法删除父节点的子节点,
RemoveAttribute( const char * name )方法删除属性值.

例如删除 broADCAST_VERSION节点

tixmlHandledocHandle( & doc);
tixmlElement * broadcast_ver = docHandle.FirstChild( " ZXML ).FirstChild( ZAPP VBS_RUNTIME_ParaMS ).toElement();

tixmlNode node -> FirstChild( broADCAST_VERSION );

broadcast_ver RemoveChild(node);

也可以删除整个SOURCE_1节点:

broadcast SOURCE_1 );

broadcast RemoveChild(node);

删除 broADCAST_VERSION的info属性:

).FirstChildElement( ).toElement();

broadcast_ver RemoveAttribute( info ); // 删除info

可以借助NextSiblingElement()方法实现递归删除.

三,添加节点,属性值

例如在SOURCE_3下添加 broADCAST_PID节点:

).toElement();
tixmlElement broadcast_Pid new tixmlElement( broADCAST_PID );
tixmlText text tixmlText( 7215 );
broadcast_Pid SetAttribute( , thepid LinkEndChild(text);
broadcast LinkEndChild(broadcast_Pid);

将在SOURCE_3后添加新的节点:

< broADCAST_PID ="thepid" > </ >

四,最后说一下中文乱码的问题

乱码是由于GB2312与UTF8之间转换不当造成的,tinyxml在处理UTF8本身没有问题,当你打开一个UTF8的文档,可以在加载的时候指定UTF8的方式,或者文档声明处指明的编码格式,tinyxml会按照相应的编码格式加载,但很多时候当我们输出或写入中文字段时会出现乱码,无论在内存,还是打印出来的内容.这是因为我们的软件通常是GB2312编码,而读取或写入的内容是UTF8,自然就会出错.可以借助网上的两个函数来实现转换(原作者不详):

voidConvertUtf8ToGBK(CString&strUtf8intlen=MultiBytetoWideChar(CP_UTF8(LPCTSTR)strUtf8-1NULLunsignedshort*wszGBK=new[len;
memset(wszGBK*2+2;
MultiBytetoWideChar;

len=WideCharToMultiByte(CP_ACP*szGBK(szGBK;
WideCharToMultiByte;

strUtf8=szGBKdelete[]szGBK]wszGBK}

voidConvertGBKToUtf8&strGBK)strGBK*wszUtf8(wszUtf8*szUtf8(szUtf8;

strGBK=szUtf8]szUtf8]wszUtf8}

TinyXml 优秀的开源 xml 解析器

相关推荐