概率机器人笔记1-2章

第一章 绪论

机器人中的不确定性

  • 机器人所处的环境。尤其是在有人的,高动态环境中。
  • 传感器。受到传感器物理限制、性能限制,以及噪声和故障。
  • 执行机构。控制噪声、机械故障等。
  • 软件。内部模型是近似模型,是真实世界的抽象,存在模型误差
  • 近似算法。

概率机器人学

概率机器人的主要思想是用概率理论的运算,明确表示机器人中的不确定性。不再只依赖可能出现情况的单一的“最好推测”,而是用概率算法来表示在整个推测空间的概率分布信息。

与传统机器人编程技术(基于模型基于行为)相比,概率方法在面对传感器的局限和模型局限时鲁棒性更强。在很多方面,概率机器人即是基于模型的,又是基于行为的技术。

概率机器人学的代价:

  1. 计算复杂性。概率算法本质上比非概率算法效率低。因为它考虑的是整个概率密度而不是单一的推测。
  2. 近似的必要性。精确的后验分布往往很难计算,不确定性可以用一个紧凑的参数模型(如高斯分布)较好的近似。

第二章 递归状态估计

概率机器人技术的核心就是由传感器数据来估计状态的思路。状态估计指的是从传感器数据来推断不能直接观测的状态变量。

基本概率公式

建模:传感器、控制、机器人状态、环境等都建某为随机变量。

正态分布概率密度函数:
p(x)=(2πσ2)−12exp⁡{ −12(x−u)2σ2} p(x)=(2\pi\sigma^2)^{-\frac12} \exp \left\{ -\frac12 \frac{(x-u)^2}{\sigma^2} \right\} p(x)=(2πσ2)21exp{ 21σ2(xu)2}
记作**N(x;u,σ2)\mathcal{N}(x;u,\sigma^2)N(x;u,σ2)**

多元状态分布概率密度函数:
p(x)=det(2πΣ)−12exp⁡{ −12(x−u)TΣ−1(x−u)} p(x)=\mathrm{det}(2\pi\Sigma)^{-\frac12}\exp\left\{-\frac12(x-u)^T\Sigma^{-1}(x-u)\right\} p(x)=det(2πΣ)21exp{ 21(xu)TΣ1(xu)}
**Σ\SigmaΣ是协方差矩阵,为半正定对称矩阵。μ\muμ**为均值矢量。

多元是单变量的泛华,对于单变量,Σ=σ2\Sigma=\sigma^2Σ=σ2,上面两式等价。

概率密度函数积分为1:
∫p(x) dx=1 \int p(x)\,\mathrm{d}x=1 p(x)dx=1
联合分布:
p(x,y)=p(X=x,Y=y) p(x,y)=p(X=x,Y=y) p(x,y)=p(X=x,Y=y)
XXXYYY独立,则有:
p(x,y)=p(x)p(y) p(x,y)=p(x)p(y) p(x,y)=p(x)p(y)

条件概率:
p(x∣y)=p(x,y)p(y)(p(y)>0) p(x|y)=\frac{p(x,y)}{p(y)}\quad(p(y)>0) p(xy)=p(y)p(x,y)(p(y)>0)
XXXYYY独立,有:
p(x∣y)=p(x)p(y)p(y)=p(x) p(x|y)=\frac{p(x)p(y)}{p(y)}=p(x) p(xy)=p(y)p(x)p(y)=p(x)
XXX

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值