如何解决古特爬虫获得时尚
我正在使用Goutte搜寻器。 因此,几个小时以来,我一直在尝试通过特定查询在搜索页面中获取div的样式属性,并且该样式具有Background-img。 因此,我首先通过
向网址发出了GET请求 $crawler = $client->request('GET',"https://www.esheeq.net/search/مسلسل+علي+رضا");
然后通过
对其进行爬网$crawler->filter(".imgBg")->attr("style")
并打印出来,它可以正常工作,但是问题是,当我更改(https://www.esheeq.net/search/مسلسل+الغرفة+الحمراء)这样的搜索查询时,它会抛出错误
Fatal error: Uncaught invalidargumentexception: The current node list is empty. in C:\xampp\htdocs\esheeqAPI\vendor\symfony\dom-crawler\Crawler.PHP:550 Stack trace: #0 C:\xampp\htdocs\esheeqAPI\api\functions.PHP(8): Symfony\Component\DomCrawler\Crawler->attr('style') #1 C:\xampp\htdocs\esheeqAPI\api\tests.PHP(4): InsertMultipleSeries() #2 {main} thrown in C:\xampp\htdocs\esheeqAPI\vendor\symfony\dom-crawler\Crawler.PHP on line 550
但是当我打开URL时,我要求它向我显示具有样式属性的imgBg类的div。那为什么我会出错,如何解决呢?
解决方法
也许可以尝试这样做:
use Symfony\Component\DomCrawler\Crawler;
// you need to urlencode arabic characters,because php doesn't do that automatically
$url = "https://www.esheeq.net/search/" . urlencode( "مسلسل+الغرفة+الحمراء" );
$html_content = file_get_contents($url);
// and then;
$crawler = new Crawler( $html_content );
$crawler->filter(".imgBg")->attr("style");
让我知道它是否无效
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。