机器学习的类型简介

机器学习可以分为三大部分

1.监督学习(Supervised Learning)
2.无监督学习(Unsupervised Learning)
3.强化学习(Reinforcement Learning)
1. 监督学习(Supervised Learning)

定义:利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练或有导师学习。即根据已有的数据集,知道输入和输出结果之间的关系。

    监督学习是从标记的训练数据来推断一个功能的机器学习任务。

    常见的有监督学习算法:回归(是针对连续型的)和分类(是针对离散型的)。最典型的算法有KNN和SVM等。

2. 无监督学习(Unsupervised Learning)

定义:根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题。即我们不知道数据集中数据、特征之间的关系,而是要根据聚类或一定的模型得到数据之间的关系。

    与监督学习不同的是,无监督学习的训练数据中不包含任何类别信息。

    无监督学习的方法分为两大类:一类为基于概率密度函数估计的直接方法;另一类是称为基于样本间相似性度量的简洁聚类方法。

    聚类,PCA和deep learning算法都属于无监督学习。

3. 强化学习(Reinforcement Learning)

定义:强化学习是智能体以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏。

    强化学习有两类:一是直接学习,二是间接学习。

    显示模型,策略梯度,Q-learning算法都是属于强化学习。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值