下图为身份证识别系统的系统框图。
四、图像二值化处理
再打开一副图片,也即获取一副彩色身份证图片后,为使得身份证号码颜色与背景色呈现较大差别,故选取R分量作为彩色图像的灰度化,接着对图像进行二值化处理。这里需要获取图像的全局阈值和局部阈值。
首先由Otsu算法(opencv已实现)获得整幅图像的全局阈值T,再由Beresen方法计算得当前像素的领域窗口内的灰度均值Tbn,再利用整个图像的最大灰度值和最小灰度值计算得到一个矫正因素b,则二值化公式可由下式子确定。
其中T为Ostu全局阈值,Tbn由下式确定:
b由下式确定:
其中g2为图像中灰度的最大值,g1为图像中灰度的最小值,C为经验系数,通常取0.12算法在函数OstuBeresenThreshold实现,实现的效果如下所示:
五、身份证号码定位
将二值化得到的图像进行黑白反色处理,即背景为黑色,身份证号码为白色,接着对图像进行闭操作后,使用findContours检测二值图像中的白色像素块的外轮廓,将符合长宽比及面积要求的轮廓提取出来。要找到的轮廓如下所示:
要做汉字识别的话,可以在这部分将汉字区域定位并剪切出来
六、号码分割
观察到所获得的裁剪出来的身份证号码图像(已经缩放至300*20分辨率大小)如下所示:
在该图像中,显然身份证号码与背景图像颜色区分度高,故进反色后,使用Otsu方法二值化后可得
要将号码分割出来,则只需进行列分割,也即统计
其中f(x,y)为介于两个字符之间的像素,该过程由函数char_segment实现
七、特征提取
提取数字字符的特征向量,也即提取梯度分布特征+灰度分布特征+水平投影直方图+垂直投影直方图,最后每个字符得到一个1*72的特征向量,由calcGradientFeat函数实现
八、神经网络训练
所使用的训练图片均由从多张身份证图片上分割得到,之后经过特征提取,获得训练矩阵和标签矩阵保存于ann_xml.xml文件中,由函数getAnnXML实现,然后由ann_train从中读取训练矩阵和标签矩阵用于神经网络训练,opencv中实现的是多层感知器神经网络。
九、分类器分类
使用训练得的神经网络对所提取的字符特征向量进行分类,由函数classify实现。
十、校验位计算
由于最后一位有时识别率不高,可能是最后一位的分割结果不是很好,故最后1位校验位直接由前17位数字计算得,由getParityBit函数实现。
十一、结果显示
该身份证号码识别系统所处理的图像必须要求身份证区域尽可能占整幅图像更多的区域,且在纯色背景下拍摄,另外需保证拍摄得的身份证图像尽可能光照均匀,不能有高光存在。如下所示
尾声
面试成功其实都是必然发生的事情,因为在此之前我做足了充分的准备工作,不单单是纯粹的刷题,更多的还会去刷一些Android核心架构进阶知识点,比如:JVM、高并发、多线程、缓存、热修复设计、插件化框架解读、组件化框架设计、图片加载框架、网络、设计模式、设计思想与代码质量优化、程序性能优化、开发效率优化、设计模式、负载均衡、算法、数据结构、高级UI晋升、Framework内核解析、Android组件内核等。
不仅有学习文档,视频+笔记提高学习效率,还能稳固你的知识,形成良好的系统的知识体系。这里,笔者分享一份从架构哲学的层面来剖析的视频及资料分享给大家梳理了多年的架构经验,筹备近6个月最新录制的,相信这份视频能给你带来不一样的启发、收获。
Android进阶学习资料库
一共十个专题,包括了Android进阶所有学习资料,Android进阶视频,Flutter,java基础,kotlin,NDK模块,计算机网络,数据结构与算法,微信小程序,面试题解析,framework源码!
大厂面试真题
PS:之前因为秋招收集的二十套一二线互联网公司Android面试真题 (含BAT、小米、华为、美团、滴滴)和我自己整理Android复习笔记(包含Android基础知识点、Android扩展知识点、Android源码解析、设计模式汇总、Gradle知识点、常见算法题汇总。)
《2017-2021字节跳动Android面试历年真题解析》
架构视频+大厂面试真题+项目实战源码》](https://codechina.youkuaiyun.com/m0_60958482/android_p7)**