微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Scrapy,从 H3 标签中获取 href 吗?

如何解决Scrapy,从 H3 标签中获取 href 吗?

目前正在尝试从以下 HTML 片段中抓取链接标题,尽管阅读了一段时间的抓取文档,但似乎无法找到任何方法

<h3 class="data"> 
  <a href="example.com" title="uniqueTitle"></a>
</h3>

这样做的最佳方法是什么?另外我应该注意到,页面上有许多 <h3> 元素具有相同的类,但我想抓取不同的 <a> 标签
提前致谢!

解决方法

要获取 h3 标签内的所有网址,您可以使用例如

from scrapy import Selector
sel = Selector(text='''<h3 class="data"> 
  <a href="example.com" title="uniqueTitle"></a>
</h3>''')
print(sel.css('h3.data > a::attr(href)').extract()) # you can use this

输出:

['example.com']

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。