32、最小充分信息转换系统解析

最小充分信息转换系统解析

在机器人与环境交互的研究中,信息转换系统(ITS)起着关键作用。我们旨在探讨如何在开发信息反馈计划时,尽可能减少或简化这些系统,这与机器学习的目标相近,即通过优化输入输出数据的差异来确定候选表示。

1. 机器人 - 环境系统的数学模型

我们将机器人嵌入环境的系统描述为内部和外部两个子系统,它们通过对称的输入输出关系相连。
- 外部系统 :对应于环境以及其中的机器人身体。设 $X$ 为该系统的状态集,状态可以是机器人在已知环境中的配置等。$U$ 是控制输入(动作)集,当在状态 $x \in X$ 应用动作 $u$ 时,状态会根据状态转换函数 $f: X \times U \to X$ 改变。在每个状态 $x$,$y = h(x)$ 是输出,其中 $h: X \to Y$ 是基于状态的传感器映射,$Y$ 是所有可能观测的集合。
- 内部系统 :即机器人的“大脑”,通过传感器映射观察外部系统,并根据策略选择动作与外部系统交互。输入是观测,输出是动作。其状态对应于通过动作结果和传感器观测收集的保留信息。我们用(I - 空间)来描述内部系统,用 $\iota$ 表示内部系统的状态(I - 状态),$I$ 表示所有 I - 状态的集合(I - 空间)。内部系统根据信息转换函数 $\varphi: I \times Y \to I$ 随每个 $y \in Y$ 演化,输出由信息反馈策略 $\pi: I \to U$ 给出的控制命令。

耦合的动态系统可以表示为:
[
\begin{cases}
x’ = f(x, \pi(\iota)) \
y

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值