爬虫开发过程中经常会遇到验证码,对于普通的非滑块验证码,首先要想办法把验证码图片保存到本地:用抓包工具抓包查看验证码图片的url,通过这个url把图片下载写到二进制文件。接下来对验证码的处理方法有三种:
- 手动输入验证码
- 接入打码平台
- 更换ip绕过验证码
先简要介绍一下如何接入打码平台实现自动打码。我选择的是云打码:http://www.yundama.com。注册成为开发者,找客服可以要到调试分用来调试,查看开发文档。
下载Python调用示例,文档结构如下:
打开YDMPython3.x.py查看源码(Python2调用示例对应的是YDMPython2.x.py):
# -*- coding: cp936 -*-
import sys
import os
from ctypes import *
# 下载接口放目录 http://www.yundama.com/apidoc/YDM_SDK.html
# 错误代码请查询 http://www.yundama.com/apidoc/YDM_ErrorCode.html
# 所有函数请查询 http://www.yundama.com/apidoc
print('>>>正在初始化...')
YDMApi = windll.LoadLibrary('yundamaAPI')
# 1. htt