模式识别与机器学习:原理、应用与挑战
1. 引言
在数据中寻找模式是一个基础且有着悠久成功历史的问题。例如,16世纪第谷·布拉赫(Tycho Brahe)的大量天文观测让约翰内斯·开普勒(Johannes Kepler)发现了行星运动的经验定律,这又为经典力学的发展提供了跳板。类似地,20世纪初原子光谱规律的发现对量子物理学的发展和验证起到了关键作用。
模式识别领域关注通过计算机算法自动发现数据中的规律,并利用这些规律采取行动,比如将数据分类到不同的类别中。下面以手写数字识别为例来详细说明。
2. 手写数字识别案例
2.1 问题描述
每个手写数字对应一个28×28像素的图像,因此可以用一个包含784个实数的向量x来表示。目标是构建一个机器,它以这样的向量x作为输入,输出数字0 - 9的标识。由于手写的多样性,这是一个具有挑战性的问题。
2.2 传统方法的局限性
如果使用基于笔画形状的手工规则或启发式方法来区分数字,在实践中会导致规则和例外的大量增加,最终结果往往不佳。
2.3 机器学习方法
采用机器学习方法可以获得更好的结果。具体步骤如下:
1. 准备训练集 :使用大量的数字集合{x1, …, xN}作为训练集,这些数字的类别通常通过逐个检查并手动标记来预先确定。
2. 表示目标向量 :用目标向量t表示每个数字的类别,每个数字图像x都有一个对应的目标向量t。
3. 训练模型 :运行机器学习算法,其结果可以
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



