本文来源公众号“大数据与人工智能Lab”,仅用于学术分享,侵权删,干货满满。
原文链接:【附论文】白话文本检测经典模型:CTPN
文字识别是AI的一项重要应用,例如将包装盒上的文字识别出来、将产品说明书上的文字识别出来、将大街上广告牌的文字识别出来等等,在现实生活中能给我们带来很大的便利,有着非常广泛的应用。
一个简单的文字识别流程如下:
Step 1. 通过手机、摄像机等设备采集含有待识别字符的图像,作为输入;
Step 2. 对图像进行尺寸缩放、明暗调整、去噪等预处理操作;
Step 3. 将图像中的单个字符、或者是连续几个字符所在的区域检测出来;
Step 4. 根据文本检测结果从图像中将文本所在区域分割出来,然后导入到模型中进行文本识别,进而得到图像中的字符信息。
其中,这个流程有两个环节非常关键,一个是“文本检测”、另一个是“文本识别”,本文将介绍“文本检测”的经典模型CTPN</