1,cookie登录
- cookie一般由前端开发用js生成,可以利用抓包尝试下破解,不过这个难度有点高,不过破解js本就是爬虫必须直面面对的
- 软件tesserract-ocr先安装,然后安装PyTesserract类库
注意:
- Windows需要下载软件安装包,再配置环境变量
- linux 直接在命令窗口输入:sudo apt-get tesseract-ocr 模拟浏览器,selenium和PIL库的截屏功能,来识别验证码(save_screenshot截图)
打码平台
selenium 来模拟拉动来破解滑动验证码
由于时间过久,滑动验证码已经更改,滑动验证码已经被放弃,现仅供参考使用
交流群:1029344413 分享资料、源码
from PIL import Image from time import sleep from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver import ActionChains from selenium.webdriver.support.wait import webdriverwait from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.common.desired_capabilities import DesiredCapabilities import random headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.132 Safari/537.36" } chrome_options = webdriver.ChromeOptions() chrome_options.add_experimental_option('w3c', False) caps = DesiredCapabilities.CHROME caps['loggingPrefs'] = {'performance': 'ALL'} class SliderVerificationCode(object): def __init__(self): # 初始化一些信息 self.left = 60 # 定义一个左边的起点 缺口一般离图片左侧有一定的距离 有一个滑块 self.url = 'https://passport.bilibili.com/login' self.driver = webdriver.Chrome(executable_path='C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe') self.wait = webdriverwait(self.driver, 20) # 设置等待时间20秒 self.phone = "17369251763" self.passwd = "abcdefg" def input_name_password(self): # 输入账号密码 self.driver.get(self.url) self.driver.maximize_window() input_name = self.driver.find_element_by_xpath("//input[@id='login-username']") input_pwd = self.driver.find_element_by_xpath("//input[@id='login-passwd']") input_name.send_keys("username") self.wait = webdriverwait(self.driver, 3) input_pwd.send_keys("passport") def click_login_button(self): # 点击登录按钮,出现验证码图片 login_btn = self.driver.find_element_by_class_name("btn-login") sleep(random.randint(3, 6)) login_btn.click() def get_geetest_image(self): # 获取验证码图片 gapimg = self.wait.until(EC.presence_of_element_located((By.CLASS_NAME, 'geetest_canvas_bg'))) sleep(2) gapimg.screenshot(r'./captcha1.png') # 通过js代码修改标签样式 显示图片2 js = 'var change = document.getElementsByClassName("geetest_canvas_fullbg");change[0].style = "display:block;"' self.driver.execute_script(js) sleep(2) fullimg = self.wait.until( EC.presence_of_element_located((By.CLASS_NAME, 'geetest_canvas_slice'))) fullimg.screenshot(r'./captcha2.png') def is_similar(self, image1, image2, x, y): '''判断两张图片 各个位置的像素是否相同 #image1:带缺口的图片 :param image2: 不带缺口的图片 :param x: 位置x :param y: 位置y :return: (x,y)位置的像素是否相同 ''' # 获取两张图片指定位置的像素点 pixel1 = image1.load()[x, y] pixel2 = image2.load()[x, y] # 设置一个阈值 允许有误差 threshold = 60 # 彩色图 每个位置的像素点有三个通道 if abs(pixel1[0] - pixel2[0]) < threshold and abs(pixel1[1] - pixel2[1]) < threshold and abs( pixel1[2] - pixel2[2]) < threshold: return True else: return False def get_diff_location(self): # 获取缺口图起点 captcha1 = Image.open('captcha1.png') captcha2 = Image.open('captcha2.png') for x in range(self.left, captcha1.size[0]): # 从左到右 x方向 for y in range(captcha1.size[1]): # 从上到下 y方向 if not self.is_similar(captcha1, captcha2, x, y): return x # 找到缺口的左侧边界 在x方向上的位置 def get_move_track(self, gap): track = [] # 移动轨迹 current = 0 # 当前位移 # 减速阈值 mid = gap * 4 / 5 # 前4/5段加速 后1/5段减速 t = 0.2 # 计算间隔 v = 0 # 初速度 while current < gap: if current < mid: a = 5 # 加速度为+5 else: a = -5 # 加速度为-5 v0 = v # 初速度v0 v = v0 + a * t # 当前速度 move = v0 * t + 1 / 2 * a * t * t # 移动距离 current += move # 当前位移 track.append(round(move)) # 加入轨迹 return track def move_slider(self, track): slider = self.wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, '.geetest_slider_button'))) ActionChains(self.driver).click_and_hold(slider).perform() for x in track: # 只有水平方向有运动 按轨迹移动 ActionChains(self.driver).move_by_offset(xoffset=x, yoffset=0).perform() sleep(1) ActionChains(self.driver).release().perform() # 松开鼠标 def main(self): self.input_name_password() self.click_login_button() self.get_geetest_image() gap = self.get_diff_location() # 缺口左起点位置 gap = gap - 6 # 减去滑块左侧距离图片左侧在x方向上的距离 即为滑块实际要移动的距离 track = self.get_move_track(gap) self.move_slider(track) if __name__ == "__main__": springAutumn = SliderVerificationCode() springAutumn.main()
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。