python selenium模拟滑动验证码

本文介绍了一种使用Python和Selenium实现B站登录页面中滑动验证码的自动化破解方法。通过定位并下载滑块背景图片,利用图像处理技术识别缺口位置,并模拟人类行为移动滑块,最终实现自动验证。

此文以B站模拟登录,滑动验证码的测试。

import random
import time
import requests

from selenium.webdriver import ActionChains
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.common.by import By
from urllib.request import urlretrieve
from selenium import webdriver
from bs4 import BeautifulSoup
import PIL.Image as image
import re


class Crack():
    def __init__(self, username, passwd):
        self.url = 'https://passport.bilibili.com/login'
        self.browser = webdriver.Chrome()
        self.wait = WebDriverWait(self.browser, 100)
        self.BORDER = 6
        self.passwd = passwd
        self.username = username

    def open(self):
        """
        打开浏览器,并输入查询内容
        """
        self.browser.get(self.url)
        keyword = self.wait.until(EC.presence_of_element_located((By.ID, 'login-username')))
        keyword.send_keys(self.username)
        keyword = self.wait.until(EC.presence_of_element_located((By.ID, 'login-passwd')))
        keyword.send_keys(self.passwd)
        # bowton.click()

    def get_images(self, bg_filename='bg.jpg', fullbg_filename='fullbg.jpg'):
        """
        获取验证码图片
        :return: 图片的location信息
        """

        bg = []
        fullgb = []
        while bg == [] and fullgb == []:
            bf = BeautifulSoup(self.browser.page_source, 'lxml')
            bg = bf.find_all('div', class_='gt_cut_bg_slice')
            fullgb = bf.find_all('div', class_='gt_cut_fullbg_slice')
        print(bg[0].get('style'))
        bg_url = re.findall('url\(\"(.*)\"\);', bg[0].get('style'))[0].replace('webp', 'jpg')
        fullgb_url = re.findall('url\(\"(.*)\"\);', fullgb[0].get('style'))[0].replace('webp', 'jpg')
        bg_location_list = []
        fullbg_location_list = []
        for each_bg in bg:
            location = {}
            location['x'] = int(re.findall('background-position: (.*)px (.*)px;', each_bg.get('style'))[0][0])
            location['y'] = int(re.findall('background-position: (.*)px (.*)px;', each_bg.get('style'))[0][1])
            bg_location_list.append(location)
        for each_fullgb in fullgb:
            location = {}
            location['x'] = int(re.findall('background-position: (.*)px (.*)px;', each_fullgb.get('style'))[0][0])
            location['y'] = int(re.findall('background-position: (.*)px (.*)px;', each_fullgb.get('style'))[0][1])
            fullbg_location_list.append(location)
        # 把资源下载到临时目录
        headers = {'User-Agent': 'Mozilla/5.0 (compatible; WOW64; MSIE 10.0; Windows NT 6.2)'}
        #urlretrieve(url=bg_url, filename=bg_filename)
        with open(bg_filename,'wb') as file:
            file.write(requests.get(url=bg_url,headers=headers).content)
        print('缺口图片下载完成')
        #urlretrieve(url=fullgb_url, filename=fullbg_filename)
        with open(fullbg_filename,'wb') as file:
            file.write(requests.get(url=fullgb_url,headers=headers).content)
        print('背景图片下载完成')
        return bg_location_list, fullbg_location_list

    def get_merge_image(self, filename, location_list):
        """
        根据位置对图片进行合并还原
        :filename:图片
        :location_list:图片位置
        """
        im = image.open(filename)
        new_im = image.new('RGB', (260, 116))
        im_list_upper = []
        im_list_down = []

        for location in location_list:
            if location['y'] == -58:
                im_list_upper.append(im.crop((abs(location['x']), 58, abs(location['x']) + 10, 166)))
            if location['y'] == 0:
                im_list_down.append(im.crop((abs(location['x']), 0, abs(location['x']) + 10, 58)))

        new_im = image.new('RGB', (260, 116))

        x_offset = 0
        for im in im_list_upper:
            new_im.paste(im, (x_offset, 0))
            x_offset += im.size[0]

        x_offset = 0
        for im in im_list_down:
            new_im.paste(im, (x_offset, 58))
            x_offset += im.size[0]

        new_im.save(filename)

        return new_im


    def is_pixel_equal(self, img1, img2, x, y):
        """
        判断两个像素是否相同
        :param image1: 图片1
        :param image2: 图片2
        :param x: 位置x
        :param y: 位置y
        :return: 像素是否相同
        """
        # 取两个图片的像素点
        pix1 = img1.load()[x, y]
        pix2 = img2.load()[x, y]
        threshold = 60
        if (abs(pix1[0] - pix2[0] < threshold) and abs(pix1[1] - pix2[1] < threshold) and abs(
                        pix1[2] - pix2[2] < threshold)):
            return True
        else:
            return False

    def get_gap(self, img1, img2):
        """
        获取缺口偏移量
        :param img1: 不带缺口图片
        :param img2: 带缺口图片
        :return:
        """
        left = 43
        for i in range(left, img1.size[0]):
            for j in range(img1.size[1]):
                if not self.is_pixel_equal(img1, img2, i, j):
                    left = i
                    return left
        return left

    def get_track(self, distance):
        """
        根据偏移量获取移动轨迹
        :param distance: 偏移量
        :return: 移动轨迹
        """
        # 移动轨迹
        track = []
        # 当前位移
        current = 0
        # 减速阈值
        mid = distance * 0.7
        # 计算间隔
        t = 0.05
        # 初速度
        v = 0

        while current < distance:
            if current < mid:
                # 加速度为正2
                a = 18
            else:
                # 加速度为负3
                a = -6
            # 初速度v0
            v0 = v
            # 当前速度v = v0 + at
            v = v0 + a * t
            # 移动距离x = v0t + 1/2 * a * t^2
            move = v0 * t + 1 / 2 * a * t * t
            # 当前位移
            current += move
            # 加入轨迹
            track.append(round(move))
            print('forword', current, distance)

        v = 0

        move = current - distance
        # 加入轨迹
        track.append(round(move))


        return track

    def get_slider(self):
        """
        获取滑块
        :return: 滑块对象
        """
        while True:
            try:
                slider = self.browser.find_element_by_xpath("//div[@class='gt_slider_knob gt_show']")
                break
            except:
                time.sleep(0.5)
        return slider

    def move_to_gap(self, slider, track):
        """
        拖动滑块到缺口处
        :param slider: 滑块
        :param track: 轨迹
        :return:
        """
        ActionChains(self.browser).click_and_hold(slider).perform()
        while track:
            x = random.choice(track)
            #x=track.pop(0)
            ActionChains(self.browser).move_by_offset(xoffset=x, yoffset=0).perform()
            track.remove(x)
            time.sleep(0.01)
        time.sleep(2)
        print('release')
        ActionChains(self.browser).release(slider).perform()
        time.sleep(2)
        #self.browser.quit()

    def crack(self):
        # 打开浏览器
        self.open()

        # 保存的图片名字
        bg_filename = './images/bg.jpg'
        fullbg_filename = './images/fullbg.jpg'

        # 获取图片
        bg_location_list, fullbg_location_list = self.get_images(bg_filename, fullbg_filename)

        # 根据位置对图片进行合并还原
        bg_img = self.get_merge_image(bg_filename, bg_location_list)
        fullbg_img = self.get_merge_image(fullbg_filename, fullbg_location_list)

        # 获取缺口位置
        gap = self.get_gap(fullbg_img, bg_img)
        print('缺口位置', gap)

        track = self.get_track(gap - self.BORDER)
        print('滑动滑块')
        #print(track)

        # 点按呼出缺口
        slider = self.get_slider()
        # 拖动滑块到缺口处
        self.move_to_gap(slider, track)
        #
        time.sleep(1)
        try:
            mspan = self.browser.find_elements_by_class_name('gt_info_content')
            if len(mspan) > 0:
                info = mspan.text
                print('info:',info)
                if '怪物吃了拼图' in info:
                    print(mspan.text)
                    time.sleep(2)
                    self.crack()

            mspan = self.browser.find_elements_by_class_name('gt_info_type')
            if len(mspan) > 0:
                info = mspan[0].text
                print('info:', info)
                if '验证失败:' in info:
                    time.sleep(2)
                    self.crack()
        except Exception as e:
            print(e)



if __name__ == '__main__':
    crack = Crack('username', 'passwd')
    crack.crack()
    print('验证成功')
### 回答1: Python Selenium可以通过模拟鼠标滑动的方式来识别滑动验证码。具体实现方法可以参考以下步骤: 1. 使用Selenium打开网页并定位到包含滑动验证码的页面。 2. 利用Selenium的find_element_by_xpath()方法定位到验证码的滑块元素和背景图片元素。 3. 利用Selenium的ActionChains类模拟鼠标滑动操作,将滑块元素拖动到背景图片元素的位置。 4. 判断是否成功通过验证码验证,如果验证成功则继续进行后续操作,否则重新进行验证码识别。 需要注意的是,滑动验证码的实现方式可能因网站而异,因此具体实现方法需要根据实际情况进行调整。 ### 回答2: Python Selenium是一种自动化测试工具,可以用于控制浏览器执行自动化操作,比如滑动验证码识别。滑动验证码通常是用于网站的登陆、注册等操作,通过鼠标模拟人手在滑动拼图或滑动滑块,达到人机交互的效果。在自动化测试中,如果能够识别滑动验证码,就可以实现完全自动化,提高效率。下面将介绍如何使用Python Selenium进行滑动验证码识别。 首先,需要安装Python3.x环境和Selenium库,可以通过pip install selenium命令进行安装。同时,还需要下载Chrome浏览器和对应的ChromeDriver,可以在官网下载,或者使用pip install chromedriver-binary命令安装。 1. 首先,需要定位滑块和背景图片。使用Selenium中的find_element_by_xpath方法或find_element_by_css_selector方法,根据网页源代码中的滑动拼图或滑动滑块的html标签和属性进行定位。同时,需要获取到背景图片的url。 2. 使用Python中的requests库获取背景图片,并将其保存到本地。根据所在位置的XPath表达式或CSS选择器,获取滑块或滑块背景的定位参数。 3. 使用Pillow库加载图片,并用crop方法获取到滑块的图片,并用convert方法将图片转换成灰度图片。 4. 判断图片的边缘信息,使用Sobel算子检测像素的边缘信息,通过循环或递归,找出图像中各个切割线的位置。 5. 根据切割线的位置计算出滑块需要滑动的距离,并使用Selenium中的ActionChains类,模拟鼠标移动和滑动操作,使其滑动到正确的位置。 以上就是Python Selenium滑动验证码识别的主要方法和步骤。需要注意的是,滑块验证码一般采用了加密算法和图像处理技术,为防止自动化操作,可能经过多次变换和加密,同时还有可能加入噪声干扰。因此,需要根据实际情况,灵活运用Python的图像处理、机器学习和深度学习等技术,提高验证码的识别率和稳定性。 ### 回答3: 近年来,网站安全性越来越高,许多网站为了避免机器人恶意攻击,采用了滑动验证码。与传统的验证码相比,滑动验证码安全性更高,更难被攻击者破解。但是,这也给爬虫程序带来了困难。Python Selenium是一款非常出色的自动化测试工具,可以用来模拟浏览器行为,也可以用于爬虫。那么,如何利用Python Selenium实现滑动验证码识别呢? 在滑动验证码识别中,可以采取以下一些方案。 第一种: 使用第三方平台 目前,市面上有很多第三方平台可以识别验证码,例如:云打码、Python Tesseract等,这些平台可以帮助我们完成验证码的识别过程。在使用这些平台时,需要先在该平台进行注册,获得API key后再通过Python Selenium调用API进行验证码的输入和识别。 第二种: 随机滑动并比对结果 另外一种解决方案是,随机化模拟用户滑动,并比对结果。这种方法需要在页面加载完成后,获取验证码图片,并使用Python的Pillow库进行处理。处理完成后,可以随机模拟用户滑动,然后比对滑块位置是否正确。当验证通过时,继续模拟其他操作即可。 第三种: 内容识别并自动滑动 第三种方案是,利用Python的图像识别库,如OpenCV、PIL等,在页面加载完成后,对验证码图片进行特征提取,然后通过算法自动计算出正确的滑块位置,并模拟用户滑动。 总的来说,三种方案各有优缺点,不同的方案适用于不同的验证码,具体选择哪种方案,需要综合考虑多方面的因素。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值