微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python – 根据属性值使用lxml对子元素进行排序

我正在尝试根据属性值对文档中的一些子元素进行排序,而实际排序的函数似乎正在工作,新的排序元素的拼接似乎不是.

from lxml import etree

def getkey(elem):
    # Used for sorting elements by @LIN.
    # returns a tuple of ints from the exploded @LIN value
    # '1.0' -> (1,0)
    # '1.0.1' -> (1,0,1)
    return tuple([int(x) for x in elem.get('LIN').split('.')])

xml_str = """<Interface>
                <Header></Header>
                <PurchaSEOrder>
                    <LineItems>
                        <Line LIN="2.0"></Line>
                        <Line LIN="3.0"></Line>
                        <Line LIN="1.0"></Line>
                    </LineItems>
                </PurchaSEOrder>
            </Interface>"""

root = etree.fromstring(xml_str)
lines = root.findall("PurchaSEOrder/LineItems/Line")
lines[:] = sorted(lines, key=getkey)
res_lines = [x.get('LIN') for x in lines]
print res_lines

print etree.tostring(root, pretty_print=True)

当我执行上面的代码时,我会看到行列表在打印[‘1.0′,’2.0′,’3.0’]时排序正确.但是,由于tostring()打印出以下内容,因此不会更新XML树.

<Interface>
  <Header/>
  <PurchaSEOrder>
    <LineItems>
      <Line LIN="2.0"/>
      <Line LIN="3.0"/>
      <Line LIN="1.0"/>
    </LineItems>
  </PurchaSEOrder>
</Interface>

我知道如何从http://effbot.org/zone/element-sort.htm进行排序,它说拼接应该是我需要更新元素顺序的所有内容,但似乎并非如此.我意识到lxml与elementtree不是100%兼容,所以作为一个完整性检查我用elementtree替换了lxml导入并获得了完全相同的结果.

解决方法:

这将排序并写入输出

import xml.etree.ElementTree as ET

tree = ET.parse("in.xml")

def getkey(elem):
    # Used for sorting elements by @LIN.
    # returns a tuple of ints from the exploded @LIN value
    # '1.0' -> (1,0)
    # '1.0.1' -> (1,0,1)
    return float(elem.get('LIN'))

container = tree.find("PurchaSEOrder/LineItems")

container[:] = sorted(container, key=getkey)

tree.write("new.xml")

或使用您自己的代码进行打印:

import xml.etree.ElementTree as ET

tree = ET.fromstring(xml_str)

def getkey(elem):
    # Used for sorting elements by @LIN.
    # returns a tuple of ints from the exploded @LIN value
    # '1.0' -> (1,0)
    # '1.0.1' -> (1,0,1)
    return float(elem.get('LIN'))

root = etree.fromstring(xml_str)
lines = root.find("PurchaSEOrder/LineItems")
lines[:] = sorted(lines, key=getkey)

输出

In [12]: print (etree.tostring(root, pretty_print=True))
        <Interface>
            <Header/>
                <PurchaSEOrder>
                    <LineItems>
                        <Line LIN="1.0"/>
                    <Line LIN="2.0"/>
                        <Line LIN="3.0"/>
                        </LineItems>
                </PurchaSEOrder>
            </Interface>

关键是root.find(“PurchaSEOrder / LineItems”),你想要找到LineItems元素并对其进行排序.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。