1.机器学习
严格定义由Tom Mitchell于1998年提出:A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.
2.监督学习(supervised learning)
监督学习的数据集是带有标签(属性)的一堆数据,根据数据是离散的还是连续的又可分为回归问题和分类问题。
2.1回归问题(regression problem)
例如,已知北京一个楼盘近些年的房价,预测未来几年的房价。在这个数据集里,每个数据有房价和面积两个标签(属性)。由数据集里的数据我们可以画出二维坐标图,得到预测函数,然后就可以预测不在数据集里的数据(即不同面积的房价)

2.2分类问题(classification problem)
例如,预测肿瘤是良性还是恶性。在数据集里,每个数据有尺寸和(良性或恶性)两种标签。由数据集,我们可以画出二维坐标图,之后我们可以预测不同大小的肿瘤应该是良性还是恶性

3.无监督学习(unsupervised learning)
无监督学习的数据集是由一堆没有标签(属性)的数据组成。如下图:

由样本集里的数据的特征自动聚合(cluster)得到结果。
本文介绍了机器学习的基本概念,包括由Tom Mitchell提出的严格定义,以及监督学习和无监督学习的详细解释。监督学习涵盖回归问题和分类问题,如预测房价和肿瘤性质;无监督学习则涉及数据的自动聚合。
321

被折叠的 条评论
为什么被折叠?



