1.机器学习
机器学习所做的事情可以用一张图来理解:
包含三个重要的环节,输入、输出、以及中间的学习过程。中间的学习过程可以理解为找一个最好的函数
f
f
f,让我们在给定输入时,得到最符合现实的输出。我们根据输入、输出的不同对机器学习算法进行一个分类。
2.机器学习分类
1.输入空间:
- 有标签:监督学习,如:预测房价。我们有很多房价的资料,每一笔资料都包含房子的特征,如地段,城市,等信息。还有该房子的售价。我们用这些资料训练 f f f,训练好的 f f f,在面对一个新的房子时,可以根据他的一些信息,准确的预测出他的价位。
- 无标签:非监督式学习,如:新闻话题分类,文章主题分类,根据新闻报道交通事故的地点,预测事故多发区。以新闻话题分类为列进行介绍。网络上有成千上万的新闻,这些新闻的主题我们并不是非常的清楚,我们拿到这些新闻后,来训练我们的模型,使得主题相同的新闻聚在一起,当我们点开某一个链接时,出现的新闻类型都是一致的。
2.输出空间
- 连续:回归,如房价预测的列子,最后得到的结果是某一个区间上的连续值。
- 分类:分类,垃圾邮件的分类,我们得到的结果只有是和否两种可能。
3.其他算法
除了以上两种大的分类外还有一些其他的算法。
半监督学习:我们给出的资料,一部分有标注,一部分没有标注。
强化学习:通过与环境的交互,学习一些东西。如自动驾驶。自动驾驶的程序,会根据他所处的环境,来进行选择下一步该怎么走。
3.常见算法
监督学习:SVM(分类),感知机算法(分类),线性回归。
非监督学习:聚类,强化学习,主成分分析(对数据进行降维),高斯混合模型。
强化学习最主要的一类算法,用到了马尔可夫链的思想。