基于梯度下降法学习连续时间神经元的时间常数
一、引言
近年来,深度学习(DL)的卓越性能备受关注。在深度学习中,通过修改大规模神经网络(NN)的连接权重,可以获取从输入到输出的完整计算功能,训练成功的神经网络比精心设计的系统更灵活、更强大。
我们生活的世界不仅有空间维度,还有时间维度。因此,在未来用于处理传感器输入序列、存储或回忆信息、生成一致的运动输出、做出决策或思考的神经网络发展中,时间处理将变得至关重要。
循环神经网络(RNN)中神经元相互连接,信息可以随时间保留,常用于学习时间序列处理。为了在RNN中生成连续输出模式或产生复杂动态,会使用由连续时间神经元组成的连续时间循环神经网络(CTRNN)。连续时间神经元的内部状态由一阶线性微分方程建模,其时间尺度由时间常数决定。时间常数较小时,神经元内部状态衰减快,主要受当前输入影响;时间常数较大时,内部状态变化缓慢,更多保留之前的内部状态,受当前输入影响小。
实际任务要求人工智能体在不同时间尺度上进行思考和行动。例如,一个人工智能体将瓶子里的果汁倒入杯子,在短时间尺度上,它需要根据倒果汁的情况快速精细地改变运动指令;在长时间尺度上,它需要在多个状态之间转换,如拿起瓶子、打开瓶盖、将果汁倒入杯子以及把装有果汁的杯子递给别人。
由静态神经元组成的RNN难以实现这种多时间尺度行为,因为其时间尺度等同于步长,所有神经元的时间尺度相同。为了给RNN引入不同的时间尺度,具有不同时间常数的连续时间神经元至关重要。已有研究表明,具有不同固定时间常数的多时间尺度CTRNN可以出现功能层次结构。
虽然修改时间常数可以帮助网络学习不同时间尺度的任务,并使神经元之间根据时间尺度出现功能层次结构,
超级会员免费看
订阅专栏 解锁全文
3253

被折叠的 条评论
为什么被折叠?



