Chapter 1(one)
Introduction
最近在读机器学习大牛Christopher M. Bishop的《Pattern Recognition and Machine Learning》。这是一本关于模式识别和机器学习的经典入门教材,但是由于自己的毕业设计和导师项目占用了绝大部分的时间,只有晚上十一点半后才有时间学习,由于自己的记忆力和理解力不强,所以自己做了学习笔记并与大家分享交流,希望大家多多指正,同广大的模式识别和机器学习的童鞋共同努力
本章一开始提及几个重要的概念:
特征提取(feature extraction):将输入的原始数据预处理成容易模式识别和机器学习算法容易处理的数据形式。如将下图中每个数字的图片事先压缩成固定大小,然后将图片分成28*28个像素,这样,一张图片就可以用一个784维的向量代表了,然后使用算法对图片中的数字进行识别。
泛化能力(generalization):已生成的模型对新数据(不再是用于训练的数据)准确处理的能力。
监督学习(supervised learning):在输入训练数据时,一同输入训练数据的真实标签,如回归,分类。