前言
验证码相信大家都遇到过,不胜其烦的一次次输入错误是不是让你一度崩溃过,今天就教大家如何用黑科技解决验证码的问题。
按照国际惯例,在这里先喂自己袋盐,可视化(tableau)和毕业设计(matlab)的小伙伴,可订阅以下博主精心整理的三个专栏。
tableau可视化数据分析高级教程
https://blog.youkuaiyun.com/wenyusuran/category_9596753.html
MATLAB深入理解高级教程(附源码)
https://blog.youkuaiyun.com/wenyusuran/category_2239265.html
深度学习100例全系列详细教程
https://blog.youkuaiyun.com/wenyusuran/category_9596890.html
在博主的资源中也有各种算法的应用实例源代码,需要的小伙伴自取哟。
captcha
captcha 是用 python 写的生成验证码的库,它支持图片验证码和语音验证码,我们使用的是它生成图片验证码的功能。
首先我们设置我们的验证码格式为数字加大写字母,生成一串验证码试试看:
数据生成器
训练模型的时候,我们可以选择两种方式来生成我们的训练数据,一种是一次性生成几万张图,然后开始训练,一种是定义一个数据生成器,然后利用 fit_generator 函数来训练。
第一种方式的好处是训练的时候显卡利用率高,如果你需要经常调参,可以一次生成,多次使用;第二种方式的好处是你不需要生成大量数据,训练过程中可以利用 CPU 生成数据,而且还有一个好处是你可以无限生成数据。
我们的数据格式如下:
X
X 的形状是 (batch_size, height, width, 3),比如一批生成32个样本,图片宽度为170,高度为80,那么形状就是 (32, 80, 170, 3),取第一张图就是 X[0]。
y
y 的形状是四个 (batch_size, n_class),如果转换成 numpy 的格式,则是 (n_len, batch_size, n_class),比如一批生成32个样本ÿ