机器学习实用案例解析
1. 机器学习实战的重要性
对于想要成为机器学习专家的人来说,仅仅掌握一些基础技术是远远不够的。现实世界的问题往往比教科书上的示例复杂得多,会出现意想不到的障碍,挑战着我们对分类器功能和目的的认知。在这个领域,创造力和实践经验都至关重要。接下来,我们将通过几个精心挑选的案例,深入了解实际应用中常见的问题以及相应的解决方法。
2. 字符识别
2.1 字符识别的应用场景
字符识别技术在当今社会有着广泛的应用,如各种表格的自动预处理、将记事本上的手写文本转换为文本编辑器可用格式的软件,以及各种报纸数字化程序等。曾经,这类任务被认为几乎不切实际,但如今已变得十分常见。
2.2 描述字符的挑战
用计算机能够理解的方式描述每个字符并非易事。例如,要解释如何区分数字“5”和“6”,或者手写的“t”和“l”,用简单的英语描述都很困难,更不用说将其转换为计算机代码了。这就是机器学习发挥作用的地方。
2.3 字符描述与属性向量
工程师需要定义用于描述示例的属性。一种常见的方法是将手写字符图像转换为属性向量,具体步骤如下:
1. 确定字符所在的矩形区域。
2. 将该区域划分为 6×4 = 64 个大小相等的区域,每个区域用一个连续属性表示,其值为该区域的平均强度。墨水越多,该区域反射的光线越少,属性值越低;如果区域内没有墨水,属性值则最大。
当然,属性的数量不一定局限于 64 个,程序需要识别的细节越多,所需的区域就越小,使用的属性数量也就越多。在实际应用中,分类器需要识别整个文本中的字符,只要能将单个字符分离出来,就可以用相
超级会员免费看
订阅专栏 解锁全文
996

被折叠的 条评论
为什么被折叠?



