机器学习三大支柱：监督、无监督与强化学习-优快云博客

1.监督学习（Supervised Learning）
2.无监督学习（Unsupervised Learning）
3.强化学习（Reinforcement Learning）

定义：利用一组已知类别的样本调整分类器的参数，使其达到所要求性能的过程，也称为监督训练或有导师学习。即根据已有的数据集，知道输入和输出结果之间的关系。

    监督学习是从标记的训练数据来推断一个功能的机器学习任务。

    常见的有监督学习算法：回归（是针对连续型的）和分类（是针对离散型的）。最典型的算法有KNN和SVM等。

定义：根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题。即我们不知道数据集中数据、特征之间的关系，而是要根据聚类或一定的模型得到数据之间的关系。

    与监督学习不同的是，无监督学习的训练数据中不包含任何类别信息。

    无监督学习的方法分为两大类：一类为基于概率密度函数估计的直接方法；另一类是称为基于样本间相似性度量的简洁聚类方法。

    聚类，PCA和deep learning算法都属于无监督学习。

定义：强化学习是智能体以“试错”的方式进行学习，通过与环境进行交互获得的奖赏指导行为，目标是使智能体获得最大的奖赏。

    强化学习有两类：一是直接学习，二是间接学习。

    显示模型，策略梯度，Q-learning算法都是属于强化学习。

机器学习的类型简介