Reinforce Learning 基础组件概念

0XQ

于 2024-12-02 21:03:42 发布

阅读量818

点赞数 25

文章标签：机器学习人工智能

本文链接：https://blog.youkuaiyun.com/weixin_42326517/article/details/143824662

版权

Reinforce Learning 基础

基础的名词概念

基础的名词概念

该文章为中国Mooc上赵世钰老师的课程，强化学习的数学原理 的课程笔记。

state

状态（state），指的是智能体对于外界环境相关的特性，通常使用 $S$ 表示。具体的状态，比如：

智能体的位置(x, y, z)
智能体的速度(v_x,v_y,v_z)

state space: 指的是state的集合。
$S = \{S_{i}\}_{i=1}^{n}$
$S$ 代表状态， ${S_{i}\}$ 代表状态的集合， $i$ 代表第 $i$ 个状态，n为状态的总数量。

Action

行为，一般用 $a_{i}$ 表示。
Action space of a state，指的是在一个时刻所有可能的行为的集合。
$A\{S_{i}\}$ = ${a_{i}\}_{i=0}^n$
$A{\{S_{i}\}}$ 代表在状态 $S_{i}$ 时的行为集合。 ${a_i\}$ 代表在状态 $i$ 时的行为。