生长拓扑学习自组织映射:原理、应用与机器人导航探索
一、引言
在计算智能和机器人技术领域,拓扑学习和拓扑保持映射是非常重要的概念。拓扑学习能够让模型学习输入空间的拓扑结构,生成真实的表示映射。一种基于表面重建问题开发的GSOSM模型,经过改进后得到了适用于更广泛空间的GTLSOM模型,并且该模型在机器人感知和导航学习中展现出了巨大的潜力。
二、为何需要拓扑学习
拓扑学习和拓扑保持映射在多个领域具有重要意义。例如,对于一个浸入三维空间的折叠表面,描述其拓扑结构的映射可以帮助我们推断两个表面的相对位置。在模式分类中,拓扑保持映射可以对输入空间进行细分,代表特定模式具有正概率密度的区域,从而确定输入样本的正确类别。因此,拓扑保持映射在计算智能中可作为存储和分类模式的记忆体。
三、GSOSM模型
GSOSM(Growing Self - Organizing Surface Map)的主要目标是从无结构的点云进行表面重建,生成近似等边且面积相似的三角形网格。其设计特点如下:
1. 增量映射过程,通过学习过程定义邻域节点。
2. 算法不依赖误差累加器或循环计数器。
3. 学习规则能够处理相似或非常不同模式的输入序列。
4. 能够为任何形状生成合适的表示。
5. 网格构建过程最终无内部、重叠或虚假面。
GSOSM算法包含九个简单步骤:
1. 参数设置
2. 样本呈现
3. 从当前样本确定最近邻节点
4. 插入新节点
5. 更新权重向量
6. 节点合并
7. 确定与当前样本的获胜连接
8. 插入或替换连接
9. 移除或交换连接
3.1 初始地图和参数
GSOSM地图的初始状态是一个空图$G(S, C)$,其中$S$是节点集,$C$是连接相邻节点对的连接集。需要指定四个参数值:
- $e_{max}$:最大局部误差,与节点之间的连接长度(三角形边)直接相关。
- $\alpha$:学习率。
- $\theta_{min}$:指定三角形最大内角接受的最小值。
- $\beta_{min}$:插入选定节点对之间新连接所需的最小相关率。
3.2 节点插入操作符
插入新节点旨在表示未映射区域的样本。GSOSM节点分布的目标是使用最少的节点表示整个输入空间。每个节点都有一个半径为$e_{max}$的球形感受野,若输入信号$\Phi$未被映射,则插入一个新节点,其权重向量$\omega_{s_{new}}$设置为输入信号$\Phi$。新节点初始时没有连接,邻域关系在连接学习过程中建立。
3.3 适应操作符
该步骤旨在根据输入空间的拓扑结构对地图进行微调。GSOSM适应模式有两个互斥的适应步骤:
- 若输入信号$\Phi$不在由三个最近节点定义的棱柱$\mathcal{P}$内,或这三个节点未相互连接,则采用类似于SOM的适应步骤:
$\omega_{s_0}=\omega_{s_0}+\alpha[\Phi - \omega_{s_0}]$
- 若$\Phi$在棱柱$\mathcal{P}$内,则采用旋转三角形的步骤,使三角形面接近正确的表面重建:
$\omega_{s_0}=\omega_{s_0}+\alpha P_n d(P, \Phi)$
其中,$P_n$是平面$P$的法向量,$d(P, \Phi)$是$\Phi$与$P$之间的距离。
3.4 合并操作符
当输入信号$\Phi$使得两个最近节点之间的距离小于$e_{max}$时,将这两个节点合并。合并后的节点$S_{new}$位于原节点位置之间,其权重向量为:
$\omega_{s_{new}} = 0.5[\omega_{s_0} + \omega_{s_1}]$
3.5 竞争连接赫布学习(CCHL)
GSOSM模型引入了竞争连接赫布学习(CCHL)规则,用于学习节点邻域关系以实现三角剖分。该规则基于二阶Voronoi图的概念,对于输入信号$\Phi$及其三个最近节点${s_0, s_1, s_2}$,要连接的节点对是形成最接近$\Phi$的边的节点对。
3.6 连接插入操作符
在GSOSM中,插入连接的主要目标是获得完整的三角剖分,生成近似等边且大小相似的三角形网格。插入连接需要满足三个条件:
1. 相关系数$\beta$满足$\beta_{min} \leq \beta \leq 0.5$:
$\beta = \frac{(\Phi - \omega_{s_i}) \cdot (\omega_{s_j} - \omega_{s_i})}{|\omega_{s_j} - \omega_{s_i}|^2}, |\Phi - \omega_{s_i}| \leq |\Phi - \omega_{s_j}|$
2. 节点$s_i$和$s_j$相对于节点$s_k$($k \in [0, 1, 2], k \neq i, j$)的相似度系数$\theta$大于或等于参数$\theta_{min}$:
$\theta = \frac{\omega_{s_i} - \omega_{s_k}}{|\omega_{s_i} - \omega_{s_k}|} \cdot \frac{\omega_{s_j} - \omega_{s_k}}{|\omega_{s_j} - \omega_{s_k}|}$
3. 连接$c_{win}$不穿过任何其他连接的Voronoi区域。
3.7 保真系数
系数$\phi$用于衡量连接的保真度表示,GSOSM使用它来确定是否应中止连接插入过程,或是否用$c_{win}$替换现有连接:
$\phi = (1 + |\beta - 0.5| + \frac{d(c_{s_is_j}, \Phi)}{|c_{s_is_j}|})^{-1}$
其中,$d(c_{s_is_j}, \Phi)$是样本$\Phi$与连接$c_{ij}$之间的距离,$|c_{s_is_j}|$是连接的长度。
3.8 连接移除操作符
连接移除操作符的目标是消除长连接和交叉连接,以避免生成非等边三角形和重叠三角形。该操作符分为两个步骤:
1. 基于ITM模型的连接移除操作符,移除长连接。
2. 使用CCHL规则查找并移除交叉连接。
四、GTLSOM模型
GTLSOM模型是GSOSM模型的扩展,适用于任何输入空间。主要进行了两项修改:
1. 调整GSOSM算法的第二个适应步骤,以适用于$n > 3$的空间。
2. 添加激活函数,使节点的激活值与参数$e_{max}$无关。
4.1 调整第二个适应步骤
GSOSM算法的第二个适应步骤需要计算平面的法向量,但对于$n > 3$的空间,叉积操作符未定义。因此,采用Sloughter(2001)提出的方法:
给定输入信号$\Phi$及其三个最近节点$s_0, s_1, s_2$和相应的模型向量$\omega_{s_i}$($i = 0, 1, 2$),若向量$\omega_{s_i}$线性独立,则确定平面$P$,并计算相关向量:
$v = \omega_{s_1} - \omega_{s_0}$
$w = \omega_{s_2} - \omega_{s_0}$
平面$P$的参数方程为:
$m = tv + sw + \omega_{s_0}$
通过一系列计算得到合适的正交向量,最终使方程变为:
$\omega_{s_0}=\omega_{s_0}+\alpha(\Phi - r)$
4.2 设置激活函数
选择高斯函数来表示节点的激活值,其输出范围在$[0, 1]$之间,并且可以通过控制$\sigma$的值来调整径向基。设置$\sigma = e_{max}$,节点$s_i$的激活水平方程为:
$a_{s_i} = exp(-\frac{|\Phi - \omega_{s_i}|^2}{2 \cdot e_{max}^2})$
4.3 拓扑保持
拓扑保持意味着生成的映射与输入空间在所有表示点及其邻域上等价。GTLSOM通过映射过程和CCHL连接学习规则确保拓扑保持:
- 映射函数$\phi: \Omega \to G$将$\Omega$中的相邻信号映射到$G$中的相邻节点。
- 逆映射函数$\phi^{-1}: G \to \Omega$将$G$中的相邻节点映射到$\Omega$中的相邻位置。
五、机器人障碍物感知和安全导航学习
使用GTLSOM使机器人能够学习周围环境,识别障碍物或空空间的存在。采用分层架构实现机器人的导航系统:
1. 第一层负责感知周围环境,产生感知信息。
2. 第二层是GTLSOM地图,对感知信息进行分组和存储,形成感知的基本记忆$\mathcal{M}_p$。
3. 第三层通过学习过程结合回忆的记忆、选定的动作和电机反馈,在记忆和动作之间产生和修改突触。
4. 第四层根据产生的判断选择要执行的动作,并将信号发送到电机子系统。
5.1 传感和感知子系统
机器人配备六个基于激光的传感器设备,每个传感器设备产生的读数经过修剪,只考虑由参数$\Gamma_{max}$指定的紧邻周围环境。每个感知信息$p$被编码为向量$\omega \in \mathbb{R}^{\Gamma}$,使用Zernick(1934)的前$\Gamma$个几何矩。
5.2 突触学习
该模块根据传感器设备的感知信息、采取的动作和电机子系统的反馈来建立或调整突触。学习通过奖惩机制进行,成功的动作会增强突触,失败的动作会削弱突触。
5.3 动作价值判断
对于每个时间点,为所有可能的动作确定价值判断。该过程考虑每个动作与前$\lambda$个激活的记忆单元之间突触存储值的平均值,输出一个$k$维向量,表示机器人对每个导航动作可行性的了解。
六、结果
进行了三组测试:
|测试集|描述|
| ---- | ---- |
|A|机器人在2D环境中导航|
|B|机器人在3D环境中导航|
|C|机器人从已知环境转移到类似环境中导航|
测试结果表明,GTLSOM模型在机器人导航学习中取得了一定的成功,但也发现了一些问题,如机器人在局部最小值处卡住,这与记忆粒度和参数设置有关。
七、结论
通过对GSOSM模型的改进,得到了GTLSOM模型,并证明了其拓扑保持能力。GTLSOM模型在机器人感知和导航学习中作为基本记忆体发挥了重要作用,实验结果表明该模型具有一定的可行性和有效性。同时,该模型的基本记忆体不依赖于感知的来源和边界外的情况,因此可以与其他认知过程共享。
以下是GSOSM算法的流程图:
graph TD;
A[参数设置] --> B[样本呈现];
B --> C[确定最近邻节点];
C --> D[插入新节点];
D --> E[更新权重向量];
E --> F[节点合并];
F --> G[确定获胜连接];
G --> H[插入或替换连接];
H --> I[移除或交换连接];
通过以上内容,我们可以看到GTLSOM模型在表面重建和机器人导航学习等领域具有广阔的应用前景,未来可以进一步优化模型参数和算法,以提高其性能和适应性。
生长拓扑学习自组织映射:原理、应用与机器人导航探索
八、参数设置与测试细节
在测试过程中,各项参数的设置对机器人的导航学习效果有着至关重要的影响。以下是详细的参数设置情况:
8.1 感知基本记忆参数
感知的基本记忆$\mathcal{M}
p$是一个GTLSOM地图,设置了两组测试子集:
|测试子集|$\Gamma$|$e
{max}$|
| ---- | ---- | ---- |
|子集1|10|20|
|子集2|10|40|
8.2 激光传感器参数
激光传感器的参数设置如下:
- 扫描范围:$sweep_range = 180^{\circ}$
- 扫描步长:$sweep_step = 10^{\circ}$
- 旋转范围(3D情况):$rotation_range = 180^{\circ}$
- 旋转步长(3D情况):$rotation_step = 15^{\circ}$
8.3 机器人运动参数
机器人的速度固定为每时间单位两个测量单位,旋转速度为每时间单位两度。
8.4 传感器与导航动作关联
传感器与导航动作的关联如下表所示:
|传感器|动作|
| ---- | ---- |
|前|前进|
|左|左转|
|右|右转|
|后|后退|
|上|上浮|
|下|下沉|
8.5 模型其他参数
模型的其他参数设置为:$\Gamma_{max} = 100$,$r = 200$,$\mu = 0.6$,$\tau = 3$,$\lambda = 3$,$\eta = 1$。系数$\alpha_r$和$\alpha_p$根据不同的测试用例进行设置。
九、各测试集详细分析
9.1 测试集A:2D环境导航
在2D环境导航测试中,绘制了多个图表来展示机器人的导航行为。当机器人面向障碍物时,不同的$\alpha_r$和$\alpha_p$组合会产生不同的结果。
例如,当感知记忆粒度参数$e_{max}^{\mathcal{M}_p} = 20$时,从图中可以看出机器人在学习避免障碍物的同时保持漫游行为。但在某些参数组合下,如$\alpha_r = 0.1$,$\alpha_p = 0.2$;$\alpha_r = 0.2$,$\alpha_p = 0.1$;$\alpha_r = 0.3$,$\alpha_p = 0.5$ 时,机器人会陷入局部最小值,所有选定的导航动作都被判断为不可行。
当$e_{max}^{\mathcal{M} p} = 40$时,也出现了类似的情况,不过在某些情况下机器人并非完全静止,而是在相反的动作(如左转和右转)之间交替。通过对比不同$e {max}$值下感知记忆中使用的单元数量,可以发现记忆粒度与机器人区分安全和不安全导航动作的能力密切相关。较大的$e_{max}$值会导致机器人区分相似上下文的能力下降,从而更容易陷入局部最小值。
以下是不同参数组合下感知记忆中使用的单元数量:
|$e_{max}^{\mathcal{M}_p}$|$\alpha_r = 0.1$,$\alpha_p = 0.1$|$\alpha_r = 0.1$,$\alpha_p = 0.2$|$\alpha_r = 0.2$,$\alpha_p = 0.1$|$\alpha_r = 0.3$,$\alpha_p = 0.3$|$\alpha_r = 0.3$,$\alpha_p = 0.5$|$\alpha_r = 0.5$,$\alpha_p = 0.3$|
| ---- | ---- | ---- | ---- | ---- | ---- | ---- |
|20|73,210|78,204|80,779|80,347|82,495|79,219|
|40|6,798|6,921|6,835|6,977|6,798|6,870|
8.2 测试集B:3D环境导航
在3D环境导航测试中,机器人除了使用2D导航的动作外,还可以进行上浮和下沉动作。由于测试集A的结果表明$e_{max}^{\mathcal{M}_p} = 20$时效果较好,因此在本测试集中设置该参数为20。$\alpha_r$和$\alpha_p$采用了(0.1; 0.1)、(0.1; 0.2)和(0.2; 0.1)三组值。测试结果与2D环境导航的结果相似,这表明该模型在3D环境中也具有一定的适用性。
8.3 测试集C:类似环境导航
此测试集的目的是评估机器人在不同但相似环境中重用知识的能力。首先,机器人在初始环境中学习导航技能,然后被转移到类似环境中两次,且不重置其记忆。参数设置为$e_{max}^{\mathcal{M}_p} = 20$,$\alpha_r = 0.1$,$\alpha_p = 0.1$,其他参数与测试集A相同。
从图中可以看出,每次转移后碰撞百分比会出现峰值,这表明机器人遇到了未知的上下文,但随后碰撞百分比逐渐下降,说明机器人能够快速学习并重用之前获得的知识。
十、总结与展望
综上所述,GTLSOM模型在机器人导航学习中展现出了一定的优势。它通过对GSOSM模型的改进,不仅适用于更广泛的空间,还能够有效地处理机器人的感知和导航问题。
然而,该模型也存在一些不足之处,例如机器人在局部最小值处卡住的问题。为了进一步提高模型的性能,可以从以下几个方面进行优化:
1.
参数优化
:通过更深入的实验和分析,找到更合适的参数组合,特别是记忆粒度参数$e_{max}$和奖惩系数$\alpha_r$、$\alpha_p$。
2.
算法改进
:研究更有效的算法来避免机器人陷入局部最小值,例如引入启发式搜索或强化学习中的探索策略。
3.
多模态感知融合
:结合更多类型的传感器,如视觉传感器、超声波传感器等,以提高机器人对环境的感知能力。
未来,随着人工智能和机器人技术的不断发展,GTLSOM模型有望在更多领域得到应用,如智能家居、工业自动化等。同时,不断的研究和改进将使其在复杂环境中的导航和决策能力得到进一步提升。
以下是机器人导航系统分层架构的流程图:
graph LR;
A[第一层:环境感知] --> B[第二层:GTLSOM地图存储];
B --> C[第三层:突触学习与价值判断];
C --> D[第四层:动作选择与执行];
D --> A;
通过以上的分析和总结,我们对GTLSOM模型在机器人导航学习中的应用有了更深入的了解,也为未来的研究和开发提供了有价值的参考。
超级会员免费看
986

被折叠的 条评论
为什么被折叠?



