如何解决是否可以从html中提取“标题”而不是“类”或“ id”以打印鼠标悬停时出现的内容?
问题简介
语言版本:Python 3.8
操作系统:Windows 10
其他相关软件:Jupyter笔记本电脑
上下文:我一直在通过隔离“类”和“ id”的CSS选择器来学习使用python和request_html进行Web解析的方法。但是,我不确定当鼠标悬停在account summary page顶部标签旁边的数字等项目上时,如何为出现的某些内容隔离“标题”。
当我将鼠标悬停在python标签旁边的数字0上时,会说
“问了7个非Wiki问题,总分为-1”
当我在Chrome中检查数字零时,可以将html与以下内容隔离:
<div class="answer-Votes" title="Asked 7 non-wiki questions with a total score of -1. " onclick="window.location.href='/search?q=user:14340924+[python]'">0</div>
我已经尝试过的事情:
我可以很接近它
>>> r.html.find('#user-panel-tags')[0].find('.user-tags')[0].find('.answer-Votes')[0].text
0
r.html.find('#user-panel-tags')[0].find('.user-tags')[0].find('.answer-Votes')[0].find('.title')[0].text
r.html.find('#user-panel-tags')[0].find('.user-tags')[0].find('.answer-Votes title')[0].text
预期结果:
问了7个非Wiki问题,总分为-1。
有什么建议吗?
解决方法
如先前在Stack的注释中所解释的,可以使用.attrs()
来获取元素的属性。 .attrs()
返回可使用.attrs()['title']
或.attrs().get('title')
进行索引的字典。其他资源可在https://github.com/psf/requests-html上找到。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。