微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

XML可扩展标记语言 -- 学习笔记二

解析xml文档

解析一个xml文档,从中取出想要的信息,例如节点中包含的文字,或者某个节点的属性,其流程如下:
1 用xmlReadFile函数读出一个文档指针doc;
2 用xmlDocgetRootElement函数得到根节点curNode;
3 curNode->xmlChildrenNode就是根节点的子节点集合;
4 轮询子节点集合,找到所需的节点,用xmlNodeGetContent取出其内容
5 用xmlHasProp查找含有某个属性的节点;
6 取出该节点的属性集合,用xmlGetProp取出其属性值;
7 用xmlFreeDoc函数关闭文档指针,并清除本文档中所有节点动态申请的内存。
注意:节点列表的指针依然是xmlNodePtr,属性列表的指针也是xmlAttrPtr,并没有xmlNodeList或者xmlAttrList这样的类型。看作列表的时候使用它们的next和prev链表指针来进行轮询。只有在Xpath中有xmlNodeSet这种类型,其使用方法前面已经介绍了。

代码如下:ParseXmlFile.cpp
#include "stdafx.h"
#include <libxml/parser.h>
#include <iostream.h>
int main(int argc,char* argv[])
{
   xmlDocPtr doc;           //定义解析文档指针
   xmlNodePtr curNode;      //定义结点指针(你需要它为了在各个结点间移动)
   xmlChar *szKey;          //临时字符串变量
   char *szDocName;
   if (argc <= 1) 
   {
       printf("Usage: %s docname\n",argv[0]);
       return(0);
    }
    szDocName = argv[1];
    doc = xmlReadFile(szDocName,"GB2312",XML_PARSE_RECOVER); //解析文件
    //检查解析文档是否成功,如果不成功,libxml将指一个注册错误并停止。
    //一个常见错误是不适当的编码。XML标准文档除了用UTF-8或UTF-16外还可用其它编码保存。
    //如果文档是这样,libxml将自动地为你转换到UTF-8。更多关于XML编码信息包含在XML标准中.
    if (NULL == doc)
    {  
       fprintf(stderr,"Document not parsed successfully. \n");    
       return -1;
    }
    curNode = xmlDocgetRootElement(doc); //确定文档根元素

    /*检查确认当前文档中包含内容*/
    if (NULL == curNode)
    {
       fprintf(stderr,"empty document\n");
       xmlFreeDoc(doc);
       return -1;
    }

    /*在这个例子中,我们需要确认文档是正确的类型。“root”是在这个示例中使用文档的根类型。*/
    if (xmlStrcmp(curNode->name,BAD_CAST "root"))
    {
       fprintf(stderr,"document of the wrong type,root node != root");
       xmlFreeDoc(doc);
       return -1;
    }
    curNode = curNode->xmlChildrenNode;
    xmlNodePtr propNodePtr = curNode;
    while(curNode != NULL)
    {
       //取出节点中的内容
       if ((!xmlStrcmp(curNode->name,(const xmlChar *)"newNode1")))
       {
           szKey = xmlNodeGetContent(curNode);
           printf("newNode1: %s\n",szKey);
           xmlFree(szKey);
       }

       //查找带有属性attribute的节点
       if (xmlHasProp(curNode,BAD_CAST "attribute"))
       {
          propNodePtr = curNode;
       }
       curNode = curNode->next;
    }

    //查找属性
    xmlAttrPtr attrPtr = propNodePtr->properties;
    while (attrPtr != NULL)
    {
       if (!xmlStrcmp(attrPtr->name,BAD_CAST "attribute"))
       {
          xmlChar* szAttr = xmlGetProp(propNodePtr,BAD_CAST "attribute");
          cout<<"get attribute = "<<szAttr<<endl;
           xmlFree(szAttr);
       }
       attrPtr = attrPtr->next;
    }
    xmlFreeDoc(doc);
    return 0;
}
将xml文件复制到项目中,设置运行参数CreatedXml.xml

运行效果

newNode1:newNode1 content

get attribute=yes

原文地址:https://www.jb51.cc/xml/300414.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。