2、机器学习基础全解析

机器学习基础全解析

1. 机器学习的学习方式

机器学习系统通常可分为有监督和无监督学习两类。有监督学习中,程序通过学习带标签的输入输出对来预测输入对应的输出,即从“正确答案”的示例中学习。无监督学习则不依赖带标签的数据,而是尝试发现数据中的模式。

1.1 有监督学习

有监督学习程序依据输入对应的带标签输出示例进行学习。机器学习程序的输出有多种称呼,这里将其称为响应变量,其他名称还包括“因变量”“回归子”“标准变量”“测量变量”“响应变量”“解释变量”“结果变量”“实验变量”“标签”和“输出变量”等。输入变量也有多个名称,这里称输入为特征,其代表的现象为解释变量,其他名称有“预测因子”“回归元”“控制变量”和“暴露变量”等。响应变量和解释变量可以取实值或离散值。

1.2 无监督学习

无监督学习的一个常见任务是在数据集中发现相关观测的组,即聚类。聚类将观测分配到不同组中,使得同一组内的观测基于某种相似性度量比与其他组的观测更相似。例如,对电影评论进行聚类,可发现积极和消极评论的集合;在市场中,可发现产品客户的细分群体;互联网电台服务可根据歌曲的流派、调式或包含的乐器对歌曲进行分组。

1.3 半监督学习和强化学习

半监督学习问题介于有监督和无监督学习之间,会同时利用有监督和无监督的数据。强化学习靠近有监督学习的一端,程序不会从带标签的输入输出对中学习,而是根据决策获得反馈,但不会明确纠正错误。例如,学习玩《超级马里奥兄弟》等横向卷轴视频游戏的强化学习程序,完成关卡或超过一定分数时会获得奖励,失去生命时会受到惩罚,但这种反馈与具体的决策(如奔跑、躲避敌人或拾取道具)并无直接关联。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值