微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

解析xml在R中列出:当xml结构不同时,如何一致地访问节点?

背景

我有一个xml设置文件可以看起来像这样:

<level1>
 <level2>
   <level3>
    <level4name>bob</level4name>
   </level3>
 </level2>
</level1>

但是可以有多个level3的实例

<level1>
 <level2>
   <level3>
    <level4name>bob</level4name> 
   </level3>
   <level3>
    <level4name>jack</level4name> 
   </level3>
   <level3>
    <level4name>jill</level4name> 
   </level3>
 </level2>
</level1>

每个级别3也可以有多种类型的4级节点:

<level3>
    <level4name>bob</level4name> 
    <level4dir>/home/bob/ </level4dir> 
    <level4logical>TRUE</level4logical> 
   </level3>

在R中,我使用这个文件加载

settings.xml <- xmlTreeParse(settings.file)
settings <- xmlToList(settings.xml)

我想编写一个脚本,将level4type1中包含的所有值转换为此级别的唯一值的向量,但是我试图以适用于上述所有情况的方式执行此操作.

其中一个问题是类(settings [[‘level2’]])是前两种情况的列表,也是第三种情况的矩阵.

> xmlToList(xmlTreeParse('case1.xml'))
$level2.level3.level4name
[1] "bob"
> xmlToList(xmlTreeParse('case2.xml'))
                  level2
level3.level4name "bob" 
level3.level4name "jack"
level3.level4name "jill"
> xmlToList(xmlTreeParse('case3.xml'))
       level2
level3 List,3
level3 List,1
level3 List,1

问题

我有两个问题:

>如何提取“level4type1”的唯一值的向量
有没有更好的办法呢?

尝试使用XML和 xpath语言的内部节点表示,这是非常强大的.
> xml = xmlTreeParse("case2.xml",useInternalNodes=TRUE)
> xpathApply(xml,"//level4name",xmlValue)
[[1]]
[1] "bob"

[[2]]
[1] "jack"

[[3]]
[1] "jill"

原文地址:https://www.jb51.cc/xml/292183.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。