机器学习可以分为三大部分
1.监督学习(Supervised Learning)
2.无监督学习(Unsupervised Learning)
3.强化学习(Reinforcement Learning)
1. 监督学习(Supervised Learning)
定义:利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练或有导师学习。即根据已有的数据集,知道输入和输出结果之间的关系。
监督学习是从标记的训练数据来推断一个功能的机器学习任务。
常见的有监督学习算法:回归(是针对连续型的)和分类(是针对离散型的)。最典型的算法有KNN和SVM等。
2. 无监督学习(Unsupervised Learning)
定义:根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题。即我们不知道数据集中数据、特征之间的关系,而是要根据聚类或一定的模型得到数据之间的关系。
与监督学习不同的是,无监督学习的训练数据中不包含任何类别信息。
无监督学习的方法分为两大类:一类为基于概率密度函数估计的直接方法;另一类是称为基于样本间相似性度量的简洁聚类方法。
聚类,PCA和deep learning算法都属于无监督学习。
3. 强化学习(Reinforcement Learning)
定义:强化学习是智能体以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏。
强化学习有两类:一是直接学习,二是间接学习。
显示模型,策略梯度,Q-learning算法都是属于强化学习。