如何解决在Scrapy中的元素之间刮取文本
我正在使用Scrapy,并且正在尝试刮擦这样的东西:
<html>
<div class='hello'>
some elements
.
.
.
</div>
<div class='hi there'>
<div>
<h3> title </h3>
<h4> another title </h4>
<p> some text ..... </p>
"some text without any tag"
<div class='article'>
some elements
.
.
</div>
<div class='article'>
some elements
.
.
</div>
<div class='article'>
some elements
.
.
</div>
</div>
</div>
</html>
如果我想从类名称为“ hi there”的div下以及类名称为“ article”的div之前的所有元素中提取文本,那么XPath或CSS选择器是否有可能枯萎?
解决方法
从未使用过Scrapy。
不知道它有什么功能,
//div[@class='hi there']/div/(div[@class='article'])[1]/preceding-sibling::*
使用“ article”类在div之前插入元素,
//div[@class='hi there']/div/(div[@class='article'])[1]/preceding-sibling::text()
在文章div之前为您提供内文。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。