微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

古特爬虫获得时尚

如何解决古特爬虫获得时尚

我正在使用Goutte搜寻器。 因此,几个小时以来,我一直在尝试通过特定查询搜索页面获取div的样式属性,并且该样式具有Background-img。 因此,我首先通过

向网址发出了GET请求
   $crawler = $client->request('GET',"https://www.esheeq.net/search/مسلسل+علي+رضا");

然后通过

对其进行爬网
$crawler->filter(".imgBg")->attr("style")

并打印出来,它可以正常工作,但是问题是,当我更改(https://www.esheeq.net/search/مسلسل+الغرفة+الحمراء)这样的搜索查询时,它会抛出错误

Fatal error: Uncaught invalidargumentexception: The current node list is empty. in C:\xampp\htdocs\esheeqAPI\vendor\symfony\dom-crawler\Crawler.PHP:550 Stack trace: #0 C:\xampp\htdocs\esheeqAPI\api\functions.PHP(8): Symfony\Component\DomCrawler\Crawler->attr('style') #1 C:\xampp\htdocs\esheeqAPI\api\tests.PHP(4): InsertMultipleSeries() #2 {main} thrown in C:\xampp\htdocs\esheeqAPI\vendor\symfony\dom-crawler\Crawler.PHP on line 550

但是当我打开URL时,我要求它向我显示具有样式属性的imgBg类的div。那为什么我会出错,如何解决呢?

解决方法

也许可以尝试这样做:

use Symfony\Component\DomCrawler\Crawler;

// you need to urlencode arabic characters,because php doesn't do that automatically

$url = "https://www.esheeq.net/search/" . urlencode( "مسلسل+الغرفة+الحمراء" );

$html_content = file_get_contents($url);

// and then;
$crawler = new Crawler( $html_content );

$crawler->filter(".imgBg")->attr("style");

让我知道它是否无效

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。