微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

TinyXml 优秀的开源 xml 解析器

分类C/C++

读取和设置xml配置文件是最常用的操作,试用了几个C++的XML解析器,个人感觉TinyXML是使用起来最舒服的,因为它的API接口和Java的十分类似,面向对象性很好。

TinyXML是一个开源的解析XML的解析库,能够用于C++,能够在Windows或Linux中编译。这个解析库的模型通过解析XML文件,然后在内存中生成DOM模型,从而让我们很方便的遍历这棵XML树。

DOM模型即文档对象模型,是将整个文档分成多个元素(如书、章、节、段等),并利用树型结构表示这些元素之间的顺序关系以及嵌套包含关系。

如下是一个XML片段:

代码链接TinyXml.zip

<Persons>
<Person ID="1"<name>周星星</name<age>20/age/Person"2">白晶晶>18/Persons>

在TinyXML中,根据XML的各种元素来定义了一些类:

tixmlBase:整个TinyXML模型的基类。

tixmlAttribute:对应于XML中的元素的属性

tixmlNode:对应于DOM结构中的节点

tixmlComment:对应于XML中的注释

tixmlDeclaration:对应于XML中的申明部分,即<?versiong="1.0"?>。

tixmlDocument:对应于XML的整个文档。

tixmlElement:对应于XML的元素。

tixmlText:对应于XML的文字部分

tixmlUnkNown:对应于XML的未知部分。

tixmlHandler:定义了针对XML的一些操作。

TinyXML是个解析库,主要由DOM模型类(tixmlBase、tixmlNode、tixmlAttribute、tixmlComment、tixmlDeclaration、tixmlElement、tixmlText、tixmlUnkNown)和操作类(tixmlHandler)构成。它由两个头文件(.h文件)和四个CPP文件(.cpp文件)构成,用的时候,只要将(tinyxml.h、tinystr.h、tinystr.cpp、tinyxml.cpp、tinyxmlerror.cpp、tinyxmlparser.cpp)导入工程就可以用它的东西了。如果需要,可以将它做成自己的DLL来调用。举个例子就可以说明一切。。。

对应的XML文件

>phinecos>22>


读写XML文件的程序代码

#include<iostream>
#include"tinyxml.h"
#include"tinystr.h"
#include<string>
#include<windows.h<atlstr>
using namespace std;

CString GetAppPath()
{//获取应用程序根目录
TCHAR modulePath[MAX_PATH];
GetmodulefileName(NULL,modulePath);
CString strModulePath(modulePath;
strModulePath=strModulePath.Left(strModulePath.ReverseFind(_T('\\';
return strModulePath;
}


/创建XML文件文件保存的路径否则false
bool CreateXmlFile(string&szFileName{
try
{
/创建一个XML的文档对象。
tixmlDocument*myDocument=newtixmlDocument/创建一个根元素并连接。
tixmlElement*RootElement=newtixmlElement"Persons";
myDocument->LinkEndChild(RootElement;


/创建一个Person元素并连接。
tixmlElement*PersonElement=new tixmlElement"Person";
RootElement->LinkEndChild(PersonElement/设置Person元素的属性
PersonElement->SetAttribute"ID"/创建name元素、age元素并连接。
tixmlElement*NameElement"name";
tixmlElement*AgeElement"age";
PersonElement-(NameElement(AgeElement/设置name元素和age元素的内容并连接。
tixmlText*NameContent=new tixmlText"周星星";
tixmlText*AgeContent"22";
NameElement-(NameContent;
AgeElement-(AgeContent;
CString appPath=GetAppPath;
string seperator"\\";
string fullPath=appPath.GetBuffer(0+seperator+szFileName>SaveFile(fullPath.c_str;/保存到文件
}
catch&e{
return false}
return true/读取Xml文件,并遍历
bool readxmlFile{
CString appPath/创建一个XML的文档对象。
tixmlDocument=new tixmlDocument>LoadFile/获得根元素,即Persons。
tixmlElement=myDocument->RootElement/输出根元素名称,即输出Persons。
cout<RootElement->Value<endl/获得第一个Person节点。
tixmlElement*FirstPerson=RootElement->FirstChildElement/获得第一个Person的name节点和age节点和ID属性
tixmlElement=FirstPerson->FirstChildElement;// 结点
tixmlElement=NameElement->NextSiblingElement;//结点
tixmlAttribute*IDAttribute>FirstAttribute;// 属性
/输出一个Person的name内容,即周星星;age内容,即;ID属性,即。
cout<NameElement->FirstChild-;
cout<AgeElement-<IDAttribute-}
int main{
string fileName"info.xml";
CreateXmlFile(fileName;
readxmlFile}

官方下载地址:https://www.jb51.cc/tinyxml

本地下载地址:http://blogimg.chinaunix.net/blog/upfile2/100811111318.zip

在TinyXML中,根据XML的各种元素来定义了一些类:
tixmlBase:整个TinyXML模型的基类。
tixmlAttribute:对应于XML中的元素的属性
tixmlNode:对应于DOM结构中的节点。
tixmlComment:对应于XML中的注释。
tixmlDeclaration:对应于XML中的申明部分,即<?versiong="1.0" ?>。
tixmlDocument:对应于XML的整个文档。
tixmlElement:对应于XML的元素。
tixmlText:对应于XML的文字部分。
tixmlUnkNown:对应于XML的未知部分。
tixmlHandler:定义了针对XML的一些操作。

例如:

?xmlversion"1.0"standalone=no<!– Our to do list data –<Todo<Item priority>Go to the<bold>Toy store!/bold>/Item>Do bills/Todo>


整个对象树:

tixmlDocument "demo.xml"
tixmlDeclaration "version=’1.0′" "standalone=no"
tixmlComment " Our to do list data"
tixmlElement "Todo"
tixmlElement "Item" Attribtutes: priority = 1
tixmlText "Go to the "
tixmlElement "bold"
tixmlText "Toy store!"
tixmlElement "Item" Attributes: priority=2
tixmlText "Do bills"

在tinyXML中,用FirstChild("名字")查找节点时,调用FirstChild函数的节点与要查找的节点必须成“父子关系”。

句柄

想要健壮地读取一个XML文档,检查方法调用后的返回值是否为null是很重要的。一种安全的检错实现可能会产生像这样的代码


tixmlElement*root=document.FirstChildElement"Document"if(root{
tixmlElement*element=root"Element"(element*child=element"Child"(child*child2=child>NextSiblingElement(child2{
// Finally do something useful.

用句柄的话就不会这么冗长了,使用tixmlHandle类,前面的代码就会变成这样:


tixmlHandle docHandle&document=docHandle.FirstChild.Child.toElement// do something useful


一、读取XML,设置节点文本
如下XML片段:

"1.0"encoding"UTF-8"standalone"yes"?<ZXML<ZAPP<VBS_RUNTIME_ParaMS<broADCAST_VERSION info"版本">8/broADCAST_VERSION<broadcast<FileCount info"资源文件个数">69/FileCount<SOURCE_1<ID info"图片编号">1/ID<Versioninfo"图片版本"/Version<Path info"图片路径"/mnt/share/1.bmp/Path<FileMode info"文件处理模式">0/FileMode/SOURCE_1<SOURCE_2/2>2/SOURCE_2.
/broadcast/VBS_RUNTIME_ParaMS/ZAPP/ZXML>

要设置broADCAST_VERSION节点的值 8为其他值,可参考如下代码(将值加1):
用ReplaceChild( tixmlNode* replaceThis,const tixmlNode& withThis )方法替换


tixmlDocument doc"zapp.conf";
doc.LoadFile;
tixmlHandle docHandle&doc*broadcast_ver"ZXML""ZAPP""VBS_RUNTIME_ParaMS""broADCAST_VERSION";
tixmlNode*oldnode=broadcast_verconstchar*ver>GetTextintoldVeratoi(ver;
CString newVer;
newVer.Format"%d"+1;
tixmlText newText(newVer;
broadcast_ver>ReplaceChild(oldnode;
AfxMessageBox(broadcast_ver;//输出

doc.SaveFile;

二,删除节点,属性

RemoveChild( tixmlNode* removeThis )方法删除父节点的子节点,
RemoveAttribute( const char * name )方法删除属性值.

例如删除broADCAST_VERSION节点

tixmlHandledocHandle( & doc);
tixmlElement
* broadcast_ver = docHandle.FirstChild( " ZXML ).FirstChild( ZAPP VBS_RUNTIME_ParaMS ).toElement();

tixmlNode
node -> FirstChild( broADCAST_VERSION );

broadcast_ver
RemoveChild(node);

也可以删除整个SOURCE_1节点:

broadcast SOURCE_1 );

broadcast
RemoveChild(node);

删除broADCAST_VERSION的info属性:

).FirstChildElement( ).toElement();

broadcast_ver
RemoveAttribute( info ); // 删除info

可以借助NextSiblingElement()方法实现递归删除.

三,添加节点,属性

例如在SOURCE_3下添加broADCAST_PID节点:

).toElement();
tixmlElement
broadcast_Pid new tixmlElement( broADCAST_PID );
tixmlText
text tixmlText( 7215 );
broadcast_Pid
SetAttribute( , thepid LinkEndChild(text);
broadcast
LinkEndChild(broadcast_Pid);

将在SOURCE_3后添加新的节点:

< broADCAST_PID ="thepid" > </ >

四,最后说一下中文乱码的问题

乱码是由于GB2312与UTF8之间转换不当造成的,tinyxml在处理UTF8本身没有问题,当你打开一个UTF8的文档,可以在加载的时候指定UTF8的方式,或者文档声明处指明的编码格式,tinyxml会按照相应的编码格式加载,但很多时候当我们输出或写入中文字段时会出现乱码,无论在内存,还是打印出来的内容.这是因为我们的软件通常是GB2312编码,而读取或写入的内容是UTF8,自然就会出错.可以借助网上的两个函数来实现转换(原作者不详):

voidConvertUtf8ToGBK(CString&strUtf8intlen=MultiBytetoWideChar(CP_UTF8(LPCTSTR)strUtf8-1NULLunsignedshort*wszGBK=new[len;
memset(wszGBK*2+2;
MultiBytetoWideChar;

len=WideCharToMultiByte(CP_ACP*szGBK(szGBK;
WideCharToMultiByte;

strUtf8=szGBKdelete[]szGBK]wszGBK}


voidConvertGBKToUtf8&strGBK)strGBK*wszUtf8(wszUtf8*szUtf8(szUtf8;

strGBK=szUtf8]szUtf8]wszUtf8}

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。