微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python爬虫如何设置随机UA

一、设置User-Agent
1、创建Request对象时指定headers
url = ‘ http://ip.zdaye.com/
head = {}
head[‘User-Agent‘] = ‘Mozilla/5.0 (Linux; Android 4.1.1; Nexus 7 Build/JRO03D) AppleWebKit/535.19 (KHTML,like Gecko) Chrome/18.0.1025.166 Safari/535.19‘
req = request.Request(url,headers=head)
#传入创建好的Request对象
response = request.urlopen(req)
html = response.read().decode(‘utf-8‘)
print(html)
2、创建Request对象后使用add_header
req.add_header(‘User-Agent‘,‘Mozilla/5.0 (Linux; Android 4.1.1; Nexus 7 Build/JRO03D) AppleWebKit/535.19 (KHTML,like Gecko) Chrome/18.0.1025.166 Safari/535.19‘)

参数为 (key,value)

二、设置代理IP
使用install_opener方法之后,会将程序认的urlopen方法替换掉。也就是说,如果使用install_opener之后,在该文件中,再次调用urlopen会使用自己创建好的opener。如果不想替换掉,只是想临时使用一下,可以使用opener.open(url),这样就不会对程序认的urlopen有影响。
from urllib import request
if name == "main":url = www.16yun.cn‘#这是代理亿牛云代理IPproxy = {‘http‘:‘168.68.8.88:66666‘}#创建ProxyHandlerproxy_support = request.ProxyHandler(proxy)#创建Openeropener = request.build_opener(proxy_support)#添加User Angentopener.addheaders = [(‘User-Agent‘,‘Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML,like Gecko) Chrome/56.0.2924.87 Safari/537.36‘)]#安装OPenerrequest.install_opener(opener)#使用自己安装好的Openerresponse = request.urlopen(url)html = response.read().decode("utf-8")print(html)

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐