如何解决Puppeteer 图像 src 选择器不适用于所有组件
尝试使用图像类提取图像 src,但仅从 40 个具有相同类名称的数据中提取了 3 个数据
标题
<div class="c2prKC" data-qa-locator="product-item" data-tracking="product-card" data-sku-simple="" data-item-id="104392229" data-aplus-ae="x1_4e3598d9" data-spm-anchor-id="a2a0e.searchlist.list.i0.84e97c034vRV1v"><div class="c3e8SH"><div class="c5TXIP"><div class="c2iYAv"><div class="cRjKsc"><a age="0" href="//www.randomname.com/products/knox-hand-sanitizer-65-ml-i104392229-s1025392201.html?search=1"><div class="c1ZEkM" age="0"></div></a></div></div><div class="c3KeDq"><div class="c3vCyH"><i class="ic-dynamic-badge ic-dynamic-badge-lazMall ic-dynamic-group-1" style="background-image: url("//laz-img-cdn.alicdn.com/tfs/TB1rYuurhTpK1RjSZFMXXbG_VXa-205-48.png"); width: 68.3333px; height: 16px;"></i></div><div class="c16H9d"><a age="0" href="//www.randomname.com./products/knox-hand-sanitizer-65-ml-i104392229-s1025392201.html?search=1" title="Knox Hand Sanitizer 65 ml">Knox Hand Sanitizer 65 ml</a></div><div class="c3gUW0"><span class="c13VH6"> 70</span></div><div class="c3lr34"></div><div class="c15YQ9"><div class="c2JB4x c6Ntq9"><i class="c3dn4k c3EEAg"></i><i class="c3dn4k c3EEAg"></i><i class="c3dn4k c3EEAg"></i><i class="c3dn4k c3EEAg"></i><i class="c3dn4k c3DcGB"></i><span class="c3XbGJ">(11)</span></div><span class="c2i43- " title="US">US</span></div></div></div></div></div>
这是页面的 HTML
// pushes the scraped image url into imageURL array
$('.c1ZEkM',html).each(function() {
let prodImg = $(this).attr('src');
imgUrl.push(prodImg);
});
输出
[
'https://static-01.randomname.com.np/p/802a0f6ca999ac42bf8d2a486cdfcf76.jpg','https://static-01.randomname.com.np/p/a92aefabcb289594ad0193912ab3bcdb.jpg','https://static-01.randomname.com.np/p/00c0147727151f7d4bc6606c1b467dfe.jpg',undefined,undefined
]
这对标题和产品价格很有效,但对于图像 URL 只能刮取 40 个 URL 中的 3 个。其他 40 个元素的 HTML 元素相同
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。