微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Python – 如何确定已解析的XML元素的层次结构级别?

我试图用Python解析XML文件中某些标记的元素,并生成输出excel文档,它包含元素并保留其层次结构.

我的问题是我无法弄清楚每个元素(通过哪个解析器迭代)嵌套的深度.

XML样本提取(3个元素,它们可以在自身内任意嵌套):

<A>
   <B>
      <C>
      </C>
   </B>
</A>
<B>
    <A>
    </A>
</B>

以下代码使用ElementTree,可以很好地迭代元素.但我认为ElementTree无法确定每个元素的嵌套深度.见下文:

import xml.etree.ElementTree as ET

root = ET.parse('XML_file.xml')
tree = root.getroot()
for element in tree.iter():
    if element.tag in ("A","B","C"):
        print(element.tag)

这将以正确的顺序获得元素A,B,C的列表.但是我需要用它们的级别信息打印出来,

所以不仅:

A
B
C
B
A

但是像这样:

A
--B
----C
B
--A

为了能够做到这一点,我需要获得每个元素的级别.有没有适合python的解析器,可以轻松做到这一点?我会想象像“element.hierarchyLevel”这样会返回一些Integer索引…

解决方法:

尝试使用递归函数,跟踪您的“级别”.

import xml.etree.ElementTree as ET

def perf_func(elem, func, level=0):
    func(elem,level)
    for child in elem.getchildren():
        perf_func(child, func, level+1)

def print_level(elem,level):
    print '-'*level+elem.tag

root = ET.parse('XML_file.xml')
perf_func(root.getroot(), print_level)

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。