微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

使用PowerShell从HTML网站获取图像链接

我想批量下载一些图片库.这些图像是免费提供的,无需任何权限.我为我的生活无法让它发挥作用.这就是我到目前为止所拥有的. $pattern吐出的是整个HTML行,而不仅仅是图像链接.你有什么指示可以给我吗?循环设置为仅运行一次以进行测试.循环将遍历所有以数字方式组织的页面.
# Variables
$i=1        # Webpage Counter
$j=1        # Image Counter
$rootDir = "http://website.com/sport/galleries/"
$saveDir = "C:\Users\user\Desktop\"
$webpagetxt = "C:\Users\user\Desktop\page.txt"
$links = "C:\Users\user\Desktop\links.txt"
$regex = "http://website.com/galleries/[0-9]*/[^\.]*.JPG"

# Create folder to download to
#New-Item -Name SIoUxSportsgalleries -ItemType directory

# Start Web Client
$client = New-Object System.Net.WebClient

# Main loop to get image links and download
    For($i=10; $i -le 10; $i++){

        # Download source code of the web page.
        $url = $rootDir+$i+'.htm'
        $webclient = new-object System.Net.WebClient
        $webpage = $webclient.DownloadString($url)
        $webpage > "$webpagetxt"

    # Parse web page and find image link.
       $pattern = Get-Content $webpagetxt | Select-String -pattern $regex -Allmatches
       echo "This is the link" $pattern
    #$pattern > $links

 }

解决方法

您需要提取匹配的值. Select-String返回对象,当你回显它时,发生的是$pattern.ToString(). ToString()返回行,而不是匹配值.这将仅返回所有链接
Get-Content $webpagetxt | Select-String -pattern $regex -Allmatches | % { $_.Matches | % { $_.Value } }

顺便说一句,你可以简单地在换行符上拆分字符串来获取一个数组(如果这是你保存它的唯一原因),而不是保存网页并用get-content重新打开它.

原文地址:https://www.jb51.cc/html/232365.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐