11、机器学习技术入门:从基础概念到实际应用

机器学习技术入门:从基础概念到实际应用

1. 强化学习基础概念

1.1 关键元素

强化学习中有几个关键元素,它们构成了整个学习过程的基础:
- 状态(State) :智能因子或智能体移动后,环境会反馈其所处的位置。
- 动作(Action) :智能因子或智能体在环境内的移动。
- 策略(Policy) :智能因子或智能体针对当前状态为后续动作或移动制定的行动计划。
- 奖励(Reward) :环境或周围给予智能因子或智能体的反馈,用于评估其移动情况。
- Q值(Q - value) :类似于价值,但多捕捉一个当前动作或移动(a)的额外参数。
- 价值(Value) :与短期奖励相反,追求长期回报。

1.2 显著特征

强化学习具有以下显著特征:
- 基于试错过程。
- 智能因子或智能体可能获得挫折性奖励。
- 无需向智能因子或智能体传授周围环境信息以及所需的移动操作。
- 智能因子或智能体需要自动探索周围环境以获取最大正奖励。
- 有基于价值、基于策略和基于模型三种执行强化学习的方法。

1.3 类型

强化学习主要分为以下两类:
- 正强化(Positive Reinforcement) :通过加入某种因素来增强某种倾向,使预期行为再次发生,能积极影响智

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值