验证码之字符分割&GUI显示

最新推荐文章于 2021-02-13 02:03:58 发布

zzshneuq

最新推荐文章于 2021-02-13 02:03:58 发布

阅读量978

点赞数 1

CC 4.0 BY-SA版权

分类专栏：字符识别文章标签：验证码图像分割 MatlabGUI 模型分类

本文链接：https://blog.youkuaiyun.com/zzshneuq/article/details/72631844

验证码思路流程：
1. 读取验证码
这里写图片描述
2.分割验证码
这里的验证码是那些背景只是一些噪点，没有很明显的横杆那种。
从图中（28*88）可知，4个字符从中间往两边看分布式均匀的，故只需将字符极左和极右找出，然后往两边各外扩使其像素达到18*4=72即可。
a)首先将三个通道RGB数据获取，二值化，然后将三个二值化图像相与，便得到第四个图
这里写图片描述
b)得到二维码的四个字的二值图像后，下面确定字符极左极右坐标

对每一列求和，数值分布如图所示
求其众数，那么众数开始上升之处便是左边第一个字符之处，由此找到了左边第一个字符的起始位置（极左），同理可得极右点；由此然后往两边各外扩使其像素达到18*4=72。再平均分割成四个字符即可。
这里写图片描述
3.识别验证码字符
首先要用到上篇文章训练好的模型_iter_1000.caffemodel、以及均值文件mean.binaryproto和由train_val.prototxt修改得到的网络框架deploy.prototxt（注不含网络层的初始条件，因其权值都已训练好，且最后层也要变动，但在数据层需要加入输入数据的格式）
content in train_val.prototxt

name: "deploy"
input: "data"
input_shape {
  dim: 1 # batchsize
  dim: 3 # number of colour channels - rgb
  dim: 28 # width
  dim: 28 # height
}
layer {
  name: "conv1"
  type: "Convolution"
  bottom: "data"
  top: "conv1"
    convolution_param {
    num_output: 32
    pad: 2
    kernel_size: 5
    stride: 1
    }
}
layer {
  name: "pool1"
  type: "Pooling"
  bottom: "conv1"
  top: "pool1"
  pooling_param {
    pool: MAX
    kernel_size: 3
    stride: 2
  }
}
layer {
  name: "relu1"
  type: "ReLU"
  bottom: "pool1"
  top: "pool1"
}
layer {
  name: "conv2"
  type: "Convolution"
  bottom: "pool1"