身份证识别
身份证识别场景
最近在做身份证识别,调研了一些方案,对于一些比较规整,光线、背景、拍照效果比较好的情况下,这种情况下进行检测和识别起来会好很多,但是现在很多情况下,场景比较开放,对于上述的光线、背景、拍照效果没有限制,毕竟每个需要识别的用户在使用的过程中不会关注这些问题,只有疫情下的时候,专门进行身份证录入的工作人员,可能受过培训,他们知道在拍身份证的时候,会把软件的摄取框对准身份证的四个边角,使得背景对识别的任务尽可能小;
身份证识别的流程
- 证件旋转功能:对上传的图片进行角度旋转,对于用户拍摄的图片,上传到服务器时,图片的旋转方向不固定,有些正好是0度,有些是90度,或者是180度、270度,都有可能,这个时候需要有正确识别当前的证件角度,将证件旋转到正确的位置;
- 证件位置定位:对于上述场景中描述,场景是自由开放的,这个时候需要能够正确识别出证件的位置和证件的四个角点,并且通过角点对证件的位置进行定位、图像进行转换,将证件能够矫正过来;
- 文字定位:能够框选出有效的文字区域,对于框选文字,目前的方案比较多,通常采用的有 CTPN、DBNet、EAST、PSE、SAST、FCE、PAN、CRAFT、SegLink等,对于这些网络,效果一般都能达到比较好的效果,对于这个任务,一般采用DBNet网络,相对而言比较简单,也好理解,效果也不错,对于这个阶段,有个问题需要注意下,就是对于不同文字块最好能够区分开,如果将不同字符块的文字框选到一个文字块,在后期的操作过程中就很难进行切分开;
- 文字识别:通俗的讲,就是将上述识别出来的文字块,进行文字识别,通常采用网络有 CRNN、RARE、SRN、SED、SAR、NRTR、Star、Rossta、SVTR等,一般采用CRNN,结构相对比较简单,效果也比较好,对于3w字形进行训练,都能达到比较好的效果
- 后处理过程:通常采用采用模版匹配的方式,这种方式如果对于比较清晰的图片识别匹配,效果不错,但是对于一些效果比较模糊的图片处理,主要关键字都能

本文介绍了身份证识别的场景、流程,包括证件旋转、位置定位、文字定位和识别,以及后处理过程。目前使用DBNet和CRNN网络,平均识别率超过95%。提供了接口试用和效果交流方式。
最低0.47元/天 解锁文章
1538

被折叠的 条评论
为什么被折叠?



