最小充分信息转换系统解析
在机器人与环境交互的研究中,信息转换系统(ITS)起着关键作用。我们旨在探讨如何在开发信息反馈计划时,尽可能减少或简化这些系统,这与机器学习的目标相近,即通过优化输入输出数据的差异来确定候选表示。
1. 机器人 - 环境系统的数学模型
我们将机器人嵌入环境的系统描述为内部和外部两个子系统,它们通过对称的输入输出关系相连。
- 外部系统 :对应于环境以及其中的机器人身体。设 $X$ 为该系统的状态集,状态可以是机器人在已知环境中的配置等。$U$ 是控制输入(动作)集,当在状态 $x \in X$ 应用动作 $u$ 时,状态会根据状态转换函数 $f: X \times U \to X$ 改变。在每个状态 $x$,$y = h(x)$ 是输出,其中 $h: X \to Y$ 是基于状态的传感器映射,$Y$ 是所有可能观测的集合。
- 内部系统 :即机器人的“大脑”,通过传感器映射观察外部系统,并根据策略选择动作与外部系统交互。输入是观测,输出是动作。其状态对应于通过动作结果和传感器观测收集的保留信息。我们用(I - 空间)来描述内部系统,用 $\iota$ 表示内部系统的状态(I - 状态),$I$ 表示所有 I - 状态的集合(I - 空间)。内部系统根据信息转换函数 $\varphi: I \times Y \to I$ 随每个 $y \in Y$ 演化,输出由信息反馈策略 $\pi: I \to U$ 给出的控制命令。
耦合的动态系统可以表示为:
[
\begin{cases}
x’ = f(x, \pi(\iota)) \
y
超级会员免费看
订阅专栏 解锁全文

10万+

被折叠的 条评论
为什么被折叠?



