3、机器学习与统计基础概述

机器学习与统计基础概述

在机器学习领域,不同的学习方法和统计概念起着至关重要的作用。下面将详细介绍聚类算法、强化学习、深度学习以及相关的统计知识。

聚类算法与无监督学习

聚类算法是一种无监督学习方法,它能将数据组织成相关的组或簇。通过这种方式,数据被分类到不同的集合中,每个集合内的数据具有相似的特征。无监督学习算法除了聚类之外,还有其他用途。例如,它可以用于提高测量数据的质量,像去除手机拍摄照片中的斑点;还能对数据集进行压缩,在不损失重要特征的前提下,减少数据在磁盘上占用的空间,这就如同 MP3 和 JPG 编码器对声音和图像所做的处理一样。

强化学习

有时候,我们希望训练计算机学习执行某项任务,但我们自己也不清楚最佳的执行方式。比如玩复杂的游戏或创作音乐时,很难确定下一步的最佳行动或选择的最佳音符,因为往往没有唯一的最佳答案。不过,我们可以大致判断某个答案比另一个更好。强化学习就是基于这样的理念,让计算机尝试各种可能的方法,我们只需对这些方法进行大致的排名,如“可能不错”或“比上一个更好”,以此来训练计算机找到实现良好结果的最佳步骤。

以设计新办公楼电梯的运行策略为例,我们的目标是最小化所有乘客的平均等待时间。然而,最佳策略会受到人们出行时间和地点模式的影响。早上大家来上班时,空电梯应停在一楼;午餐时间大家想外出,空闲电梯应停在高层;下雨时,很多人可能想去顶层的餐厅,电梯策略又需要调整。由于没有单一的最佳策略,我们只能让计算机尝试不同的方法,根据乘客的平均等待时间为每个策略打分,选择得分最高的策略。随着时间推移和模式变化,不断尝试新方法,始终保留得分最高的策略。强化学习技术是近年来在围棋和《星际争霸》等在线策略游戏中击败人类大师的游戏

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值