生物启发式神经网络中的学习研究
1. 实验参数设定
在实验中,使用了 0.08 的学习率和 0.000015 的遗忘率,这两个值均通过实验确定。遗忘率的设定是考虑到,如果其值过高,在碰撞期间增强的突触权重会在智能体遇到下一个障碍物之前迅速衰减。神经元的激活程度根据每个时间窗口内记录的动作电位数量,被归一化到 0 - 1 的范围内。
系统设计为,每当智能体撞到障碍物时,相应碰撞传感器的激活会使与之关联的运动神经元放电。同时,接近障碍物会激活感觉神经元和/或相应的中间神经元。感觉神经元和/或中间神经元与相应运动神经元之间的连接通过赫布学习规则得到强化。学习过程中涉及的神经元之间的初始突触权重设定为,在模拟开始时,运动神经元仅由相应的碰撞传感器激活。但系统学习后,会发生多模态关联,运动神经元将由感觉神经元或中间神经元激活,而非碰撞传感器。碰撞传感器的功能受到相关实验的启发。
2. 含中间神经元的学习实验
2.1 实验架构与初始权重
该实验采用的神经元架构包含八个感觉神经元、两个中间神经元和两个运动神经元。初始突触权重如下表所示:
| Neurons | - | s1 | s2 | s3 | s4 | s5 | s6 | s7 | s8 | m1 | m2 |
| ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- |
| i1 | 0.7 | 0.7 | 0.7 | 0.7 | - | - | - | - | 0.49 | 0.29 |
| i2 | - | - | - | - | 0.7
超级会员免费看
订阅专栏 解锁全文
1724

被折叠的 条评论
为什么被折叠?



