OCR应用非常广泛,而且有许多方法,今天用KNN算法实现简单的0-9手写数字识别。本程序使用OpenCV 3.0和Python 3。
KNN算法是K近邻分类算法,属于机器学习中的监督学习,需要一定量的带标签的输入样本数据进行“训练”,然后就可以识别。我给“训练”打引号是因为其实KNN没有明显的前期训练过程,它是要给一个样本x分类,就从数据集中在x附近找离它最近的k各数据点,这k个数据点中包含的y类别最多,那么就把x的标签标记为y,这就完成了分类识别的过程。
首先,利用OpenCV自带的手写数字样本集digits.png来进行初始训练:
def initKnn():
knn = cv2.ml.KNearest_create()
img = cv2.imread('digits.png')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
cells = [np.hsplit(row,100) for row in np.vsplit(gray,50)]
train = np.array(cells).reshape(-1,400).astype(np.float32)
trainLabel = np.repeat(np.arange(10),500)
return knn, train, trainLabel
KNN算法实现手写数字识别

本文通过KNN算法实现0-9手写数字识别,利用OpenCV 3.0和Python 3进行处理。KNN是监督学习中的分类算法,通过找到最近的k个邻居来决定样本分类。文章提供了训练数据集来源,并附有演示视频和完整代码链接。
最低0.47元/天 解锁文章
1318





