Photo OCR问题描述
随着网络上的图片的数量越来越多,读取图片上的文字成为了一个日益增强的需求。
按照photo ocr问题的各个处理流程,我们可以大致为不同的环节分配不同数量的人去进行。
滑动窗口(Sliding Windows)
文字检测和行人检测的差别:
行人由于其矩形的长宽比例(ratio)大致比较固定(根据距离远近不同产生差别),因此可能较为容易检测。而文字则可能有各种各样的形状,相对比较难以确认其所在的区域。
如果要建立一个行人检测的系统,我们需要一些形状/像素相同的照片,分别是有行人的正例,和没有行人的反例。