反爬之点触验证码

最新推荐文章于 2024-10-10 12:33:22 发布

BIANBH

最新推荐文章于 2024-10-10 12:33:22 发布

阅读量500

点赞数

CC 4.0 BY-SA版权

分类专栏：反反爬虫文章标签： python 爬虫反爬验证码

本文链接：https://blog.youkuaiyun.com/qq_42783263/article/details/96503396

本文介绍了如何使用Python和Selenium应对点触验证码的反爬策略。通过模拟真实用户操作，包括移动鼠标、截取验证码、调用第三方打码平台获取坐标并模拟点击轨迹，成功绕过点触验证码，提高爬虫通过率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

python 解决验证码反爬（一）

导语

大家在使用python 爬取数据时，都会经常遇到网站的一些反扒措施。例如：js加密、验证码、IP封锁等等。而今天更大家分享的就是关于验证码的反反爬，验证码是我们最为常见的一种反爬手段，为了验证是人进行访问还是机器进行访问。所以我们需要去通过模拟人的操作，让服务器误以为是人为的进行访问，从而达到反反爬的目的。

思路

我们以易盾 http://dun.163.com/trial/picture-click 的点触验证码为例。我们使用 selenuim 这个库去自动化驱动浏览器访问，然后获取到验证码图片，将图片发给打码平台（以超级鹰为例），通过打码平台返回的点触坐标，通过模拟人为的轨迹（移动、点触）从而实现反反爬。

开发工具

Python版本：3.5

环境搭建

pip 安装需要的模块
下载 selenuim 浏览器驱动，不同的浏览器需要下载不同的驱动
将下载好的驱动放置环境变量中的文件夹下，也可以放到Python解释器的根目录

具体实现步骤

1. 设置初始化参数、驱动启动参数

import time
from io import BytesIO
from PIL import Image
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver import ActionChains
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By

from chaojiying import Chaojiying_Client

# 实现点触验证码 以易盾为例  打码平台为超级鹰
class TouchCaptcha(object):
    def __init__(self, un, pw, id):
        self.url = 'http://dun.163.com/trial/picture-click'  # 网址
        self.un = un  # 打码平台账号
        self.pw = pw  # 密码
        self.id = id  # 软件ID
        chrom_option = self.set_options()
        self.diver = webdriver.Chrome(chrome_options=chrom_option)
        self.wait = WebDriverWait(self.diver, 10)

    # 设置启动参数
    def set_options(self):
        option = Options()
        option.add_argument("--window-size=1366, 1100")
        option.add_argument("disa