微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

html – 从网页中提取*相关*图像

我有一些Twitter推动的新闻聚合网站.我一直在计划添加我在twitter上找到的文章中的图像.

如果我下载页面并使用< img>提取图像标签,我得到一堆图像;并非所有这些都与文章相关.例如,捕获按钮,图标,广告等的图像.如何提取文章随附的图像?我知道有一个解决方案 – Facebook链接共享器做得非常好.

大额牛

重复:How to find and extract “main” image in website

解决方法

已经很久了.但这可能有助于下一次.

您可以使用此API https://urlmeta.org/

它使用起来非常简单,结果是我们所需要的.

使用API​​的示例:

<?PHP
$url = "http://timesofindia.indiatimes.com/business/india-business/Raghuram-Rajan-not-fit-to-be-RBI-Governor-Subramanian-Swamy/articleshow/52236298.cms";

$result = file_get_contents('https://api.urlMeta.org/?url='.$url);
$array = json_decode($result,1);
print_r($array['Meta']['image']);

?>

这就是你需要的结果.

原文地址:https://www.jb51.cc/html/226016.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐