验证码思路流程:
1. 读取验证码
2.分割验证码
这里的验证码是那些背景只是一些噪点,没有很明显的横杆那种。
从图中(28*88)可知,4个字符从中间往两边看分布式均匀的,故只需将字符极左和极右找出,然后往两边各外扩使其像素达到18*4=72即可。
a)首先将三个通道RGB数据获取,二值化,然后将三个二值化图像相与,便得到第四个图
b)得到二维码的四个字的二值图像后,下面确定字符极左极右坐标
对每一列求和,数值分布如图所示
求其众数,那么众数开始上升之处便是左边第一个字符之处,由此找到了左边第一个字符的起始位置(极左),同理可得极右点;由此然后往两边各外扩使其像素达到18*4=72。再平均分割成四个字符即可。
3.识别验证码字符
首先要用到上篇文章训练好的模型_iter_1000.caffemodel、以及均值文件mean.binaryproto和由train_val.prototxt修改得到的网络框架deploy.prototxt(注不含网络层的初始条件,因其权值都已训练好,且最后层也要变动,但在数据层需要加入输入数据的格式)
content in train_val.prototxt
name: "deploy"
input: "data"
input_shape {
dim: 1 # batchsize
dim: 3 # number of colour channels - rgb
dim: 28 # width
dim: 28 # height
}
layer {
name: "conv1"
type: "Convolution"
bottom: "data"
top: "conv1"
convolution_param {
num_output: 32
pad: 2
kernel_size: 5
stride: 1
}
}
layer {
name: "pool1"
type: "Pooling"
bottom: "conv1"
top: "pool1"
pooling_param {
pool: MAX
kernel_size: 3
stride: 2
}
}
layer {
name: "relu1"
type: "ReLU"
bottom: "pool1"
top: "pool1"
}
layer {
name: "conv2"
type: "Convolution"
bottom: "pool1"