照片OCR 照片OCR就是想要读取图像中的文字,因此工作流程如下: 1、文本检测 2、字符切割 3、字符识别 一、首先来看文本检测——滑动窗口 1、先学习行人检测的思路。 1)首先要确定检测框的尺寸8040 拿到一个数据集,训练出一个分类器,能够判断8040的图像内有没有行人。 2)对于输入一张图片,从图片左上角开始划一个检测框,送入分类器识别是否有行人;再根据步长来移动检测框,直到划过了整张图片。 还可以使用更大一点的检测框,但是需要resize到80*40的大小才能送入分类器识别。 3)最后能够在这个图中,识别出行人位置。