- 博客(1)
- 资源 (3)
- 问答 (6)
- 收藏
- 关注
原创 印刷体汉字粗分类
本文中粗分类器采用了最小距离分类器。用汉字的黑色像素点个数来进行粗分类,粗分类的目的是缩小输入样本的待匹配样本数目。首先将6404个字符作为训练样本提取样本的像素特征,再根据汉字的复杂程度将其大致分为五类,然后用提取测试样本特征,采用最小距离法与五个分类比较,将其归为距离最小的一类。 (1) size=hight*width; black=bsum/size; size为图片面积,bsum为
2017-02-23 14:16:52
1895
tesseract-ocr-3.02-vs2008.zip
2017-03-27
python split()分割
2017-10-20
对于数据量较大的特征用什么方法训练比较好?
2017-07-06
vs2012连接tesseract-OCR
2017-03-29
MATLAB运行CNN程序问题
2017-03-02
怎么把图片转化为idx3-ubyte格式
2017-03-09
将图片中不连通的点去掉
2016-11-27
TA创建的收藏夹 TA关注的收藏夹
TA关注的人