机器学习实用案例:字符识别与溢油识别
1. 机器学习实用案例的重要性
对于想要成为机器学习专家的人来说,仅仅掌握一些基础技术是远远不够的。现实世界中的问题往往比教科书上的示例复杂得多,会出现意想不到的障碍,挑战着我们对分类器功能和目的的认知。在机器学习领域,创造力和实践经验至关重要。接下来,我们将通过字符识别和溢油识别这两个精心挑选的案例,深入了解实际应用中常见的问题以及相应的解决方法。
2. 字符识别案例分析
2.1 字符识别的应用场景
字符识别技术在许多领域都有广泛的应用,如各种表格的自动预处理、将记事本上的手写文本转换为文本编辑器可用格式的软件,以及报纸数字化程序等。曾经,这样的任务被认为几乎是不现实的,但如今已变得十分常见。
2.2 描述手写字符的属性向量
要让计算机识别手写字符并非易事。例如,用英语解释如何区分数字“5”和“6”,或者手写的“t”和“l”,都会让人感到困难,而将这些解释转化为计算机能理解的代码则更具挑战性。因此,机器学习技术应运而生。
工程师需要定义用于描述示例的属性。一种常见的方法是:
1. 确定包含数字的矩形区域。
2. 将该区域划分为 6×4 = 64 个大小相等的字段,每个字段用一个连续属性表示,其值为该字段的平均强度。墨水越多,字段反射的光越少,属性值越低;如果字段没有墨水,属性值则最大。
当然,属性数量不一定局限于 64 个。程序需要识别的细节越多,所需的字段就越小,描述示例的属性数量也就越多。在实际应用中,分类器需要识别整个文本中的字符,只要能将单个字符分离出来,就可以用相同的属性向量描述方法进行处理。如今,我
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



