登录流程
前言
本系列介绍了如何使用DrissionPage库自动化操作,包括模拟搜索、登录验证、动态页面滑动抓取,以及从商品列表中提取标题、价格等信息,详细展示了如何完成京东商品数据及评论数据的抓取,本篇文章只介绍登录相关
1、流程分析
打开京东登录页面发现有三种登录方式,如下图

这里只介绍短信登录和密码登录两种方式,其实两种登录方式流程基本一致,短信验证多了一个验证码处理的步骤,因为两种方式都涉及到了滑块验证,先介绍下滑块验证的流程
1.1 滑块验证
1.1.1 识别滑块距离

判断出现滑块后,直接用DrissionPage获取背景图片和滑块的base64字符串,这里有两个小细节需要注意一下,一是两种登录方式的图片背景CSS结构不同,二是滑块不是100%出现,有可能输入密码后直接登录成功
bk_selector = 'css:#content div.JDJRV-bigimg > img'
slide_selector = 'css:#content div.JDJRV-smallimg > img'
bk_base64 = page.ele(bk_selector).attr('src')
slide_base64 = page.ele(slide_selector).attr('src')

对 base64 字符串解码保存为图片,使用 链接: ddddocr 识别滑块缺口距离,这种方式得到的距离值可能需要微调
滑块图

背景图

det = ddddocr.DdddOcr(det=False, ocr

最低0.47元/天 解锁文章
7万+

被折叠的 条评论
为什么被折叠?



