机器学习的实用案例解析
1. 机器学习在实际应用中的挑战与机遇
对于想要成为机器学习专家的人来说,仅仅掌握一些基础技术是远远不够的。现实世界的问题往往比教科书上的示例复杂得多,会出现意想不到的障碍,挑战着我们对分类器功能和目的的认知。在这个过程中,创造力和实践经验至关重要。下面通过字符识别和溢油识别两个实际案例,深入了解机器学习在实际应用中会遇到的问题及解决方法。
2. 字符识别
2.1 字符识别的应用场景
字符识别技术可以将手写文本转换为计算机可处理的格式,在自动化表单预处理、手写笔记转换为文本编辑器可用格式以及报纸数字化等领域有广泛应用。曾经,这样的任务被认为几乎不切实际,但如今已变得十分常见。
2.2 描述手写字符的属性向量
要让计算机识别手写字符,需要用属性向量来描述这些字符。以下是具体步骤:
1. 确定矩形区域 :找出包含数字的矩形区域。
2. 划分区域 :将该矩形区域划分为 6×4 = 64 个大小相等的区域。
3. 定义属性 :每个区域用一个连续属性表示,其值为该区域的平均强度。墨水越多,反射光越少,属性值越低;若区域无墨水,属性值最大。
实际上,属性数量并非固定为 64 个。程序所需的细节程度越高,划分的区域就越小,使用的属性数量也就越多。只要能将单个字符分离出来,就可以用属性向量描述每个字符,实现对整个文本的识别。现在,我们可以下载包含数十万手写字符的数据集,这些数据集采用了不同的描述方法。
超级会员免费看
订阅专栏 解锁全文

997

被折叠的 条评论
为什么被折叠?



