微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

在Python中,如何引用包含连字符的XML标记

我正在尝试使用BeautifulSoup来解析XML文件.其中一个元素中有一个连字符:分布代码

我该如何访问它?我试过了:

soup.distribution-code
soup."distribution-code" (tried single quotes too)
soup.[distribution-code]

但这些都不起作用.

解决方法:

您可以使用常规Python语法(即obj.name)通过属性引用访问非连字符元素,但是, – 使用该语法时不是有效字符(Python将其视为“减号”运算符),因此您无法访问通过该方法的元素.

相反,使用soup.find()或soup.find_all():

>>> from bs4 import BeautifulSoup
>>> soup = BeautifulSoup('<thing><id>1234</id><distribution-code>555444333</distribution-code></thing>')
>>> soup.thing
<thing><id>1234</id><distribution-code>555444333</distribution-code></thing>
>>> soup.id
<id>1234</id>
>>> soup.distribution-code
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
NameError: name 'code' is not defined
>>> soup.find('distribution-code')
<distribution-code>555444333</distribution-code>

或者,正如chepner’s comment中所指出的,您可以使用getattr()和setattr()来获取和设置包含连字符的属性.我认为soup.find()是访问这些元素的更常用方法.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。