微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

是否可以从html中提取“标题”而不是“类”或“ id”以打印鼠标悬停时出现的内容?

如何解决是否可以从html中提取“标题”而不是“类”或“ id”以打印鼠标悬停时出现的内容?

问题简介

语言版本:Python 3.8

操作系统:Windows 10

其他相关软件:Jupyter笔记本电脑

上下文:我一直在通过隔离“类”和“ id”的CSS选择器来学习使用python和request_html进行Web解析的方法。但是,我不确定当鼠标悬停在account summary page顶部标签旁边的数字等项目上时,如何为出现的某些内容隔离“标题”。

当我将鼠标悬停在python标签旁边的数字0上时,会说

“问了7个非Wiki问题,总分为-1”

当我在Chrome中检查数字零时,可以将html与以下内容隔离:

<div class="answer-Votes" title="Asked 7 non-wiki questions with a total score of -1. " onclick="window.location.href='/search?q=user:14340924+[python]'">0</div>

我已经尝试过的事情:

我可以很接近它

>>> r.html.find('#user-panel-tags')[0].find('.user-tags')[0].find('.answer-Votes')[0].text
0
r.html.find('#user-panel-tags')[0].find('.user-tags')[0].find('.answer-Votes')[0].find('.title')[0].text

r.html.find('#user-panel-tags')[0].find('.user-tags')[0].find('.answer-Votes title')[0].text

预期结果:

问了7个非Wiki问题,总分为-1。

有什么建议吗?

解决方法

如先前在Stack的注释中所解释的,可以使用.attrs()来获取元素的属性。 .attrs()返回可使用.attrs()['title'].attrs().get('title')进行索引的字典。其他资源可在https://github.com/psf/requests-html上找到。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。