python3.X爬虫针对拉钩,直聘,大街等招聘网站的简历爬虫遇到的滑块验证码,文字点击的验证码总结二( pycharm运行,代码篇)

本文介绍了使用selenium+chrome解决登录时的滑块验证码和点击样式的验证码问题。详细讲述了滑块验证码的破解原理,包括使用超级鹰验证码平台,并提供了相应的代码实现。同时,文章还涵盖了点击验证码的识别方法,同样依赖于超级鹰平台返回的坐标进行模拟点击。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

今天主要讲一下在处理账号密码类的登陆问题,我这边采取的解决办法是selenium+chrome方案,包括的内容有滑块验证码的破解原理 ,点击样式的验证码的破解以及进入登陆界面后的cookie 转换成requests中的cookies(这里主要是提升爬取的效率):

 

                                                     

 

这里直接上代码 :

from selenium import webdriver

   options = webdriver.ChromeOptions()
    #设置中文
    options.add_argument('lang=zh_CN.UTF-8')
    #更换头部
    ua =UserAgent()
    options.add_argument('user-agent="%s"' % ua.random)
    # options.add_argument('--proxy-server=http://'+get_proxy())
    # options.add_argument("--headless")
    driver=webdriver.Chrome("D:\chromedriver.exe",chrome_options=options)

    driver.maximize_window()
    driver.get("https://passport.lagou.com/login/login.html")
    sleep(4)
    driver.find_element_by_xpath("/html/body/section/div[2]/div[1]/div[2]/form/div[1]/input").send_keys(username)
    sleep(random.randint(1,2))
    driver.find_element_by_xpath("/html/body/section/div[2]/div[1]/div[2]/form/div[2]/input").send_keys(password)
    sleep(random.randint(1,2))
    driver.find_element_by_xpath("/html/body/section/div[2]/div[1]/div[2]/form/div[5]/input").click()
    sleep(random.randint(3,6))

接下来就是会出现验证码的情况:

这里分三种情况来讲述

1.没有出现任何验证码,那就直接进行登陆跳转了

2.出现滑块验证码的识别

这里先剖代码(这里使用春秋的滑块作为讲解,主要是拉钩变化无常,原理一样):

使用的验证码代理是超级鹰

from selenium import webdriver
from time import sleep
from PIL import Image
from selenium.webdriver import ActionChains
from chaojiying import Chaojiying_Client
#coding=utf-8
import sys
import importlib
importlib.reload(sys)
from PIL import Image,ImageDraw,ImageFont
import requests
from get_track import get_track
import random
chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument("--start-maximized")
browser = webdriver.Chrome("D:/chromedriver.exe")
browser.get('https://account.ch.com/NonRegistrations-Regist')
sleep(2)
browser.find_element_by_xpath("/html/body/div[3]/div[1]/div/div[3]/div[1]/div[2]").click()
sleep(1)
browser.find_element_by_xpath("/html/body/div[3]/div[1]/div/div[3]/div[3]/div[1]/input").send_keys("995368208@qq.com")
browser.find_element_by_xpath('/html/body/div[3]/div[1]/div/div[3]/div[3]/div[2]/input').send_keys("h123456")
sleep(3)

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值