第一章:绪论
傍晚小街路面上沁出微雨后的湿润,和熙的细风吹来,抬头看看天边的晚霞,嗯,明天又是一个好天气。走到水果摊旁,挑了个根蒂蜷缩、敲起来声音浊响的青绿西瓜,一边满心期待着皮薄肉厚瓢甜的爽落感,一边愉快地想着,这学期狠下了工夫,基础概念弄得清清楚楚,算法作业也是信手拈来,这门课成绩一定差不了!
1.1定义
机器学习类似于人的经验判断。人能够通过自己大脑中的一个经验来判断一个西瓜是否是好瓜还是坏瓜。
机器学习所研究的就是从学习算法中得到一个模型,通过加入数据对模型的训练,让这个模型有判断同类数据的经验。模型=人的经验数据=许多个瓜(算法有点像人的大脑,毕竟要从中通过大量数据提取出模型,就像是人经历知道很多个好瓜坏瓜的区别就可以知道啥是判断经验了)
1.2基本术语
假设我们收集了一批西瓜的数据,例如:(色泽=青绿;根蒂=蜷缩;敲声=浊响), (色泽=乌黑;根蒂=稍蜷;敲声=沉闷), (色泽=浅自;根蒂=硬挺;敲声=清脆)每对括号内是一个西瓜的记录,“=”意思是“取值为”,相应的基本术语就是下面的东西了:
所有记录的集合为:数据集。(同一类型)
每一条记录为:一个实例(instance)或样本(sample)。
例如:色泽或敲声:单个的特点为特征(