【长序列推荐、勒让德记忆单元】Legendre Memory Units: Continuous-Time Representation in Recurrent Neural Net

本文介绍了一种新的递归神经网络单元——勒让德记忆单元(LMU),该单元能够在连续时间中对输入信号进行正交化处理,并且能够有效解决长序列推荐问题。LMU通过一组耦合的常微分方程来逼近连续时间延迟函数,能够存储和处理高频率输入,相比传统的RNN和LSTM,在处理无限时间步长的问题上更具优势。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

#论文题目:【长序列推荐】Legendre Memory Units: Continuous-Time Representation in Recurrent Neural Networks(勒让德记忆单元:递归神经网络中的连续时间表示)
#论文地址:https://www.researchgate.net/publication/337985170_Legendre_Memory_Units_Continuous-Time_Representation_in_Recurrent_Neural_Networks
#论文源码开源地址:https://github.com/abr/neurips2019
#论文所属会议:NeurIPS 2019
#论文所属单位: 滑铁卢大学
在这里插入图片描述

一、导读

我们知道,RNN、LSTM模型可以很好的提取序列推荐中在连续时间步的特征(LSTM在时间步为T=500~1000、 RNN在时间步T=2000~5000),但是在T → \rightarrow ∞ \infty 时候,还尚不清楚其如何应对此类问题,所以,该论文提出了一种新型的基于生物神经网络的方法LMU。

二、模型结构

2.1 数学角度近似

勒让德存储单元(LMU)的主要组成部分是一个存储单元,它使其连续时间中的输入信号u(t) ∈ R在长度θ ∈ R>0的滑动窗口上正交化。该单元由连续时间延迟的线性传递函数F(s)= e-θs得出,最佳近似方法为d耦合常微分方程(ODEs):
在这里插入图片描述
m(t) ∈ Rd是d维的状态向量,常数(A,B)使用Padé估计近似求得:
在这里插入图片描述
该动态系统的关键特性是上一时刻的m通过勒让德多项式表示u的滑动窗口,直到d-1次(类似LSTM的输入门原理):
在这里插入图片描述
Pi®是第i个移位勒让德多项式,这给出了唯一和最佳的分解,其中m的函数对应于投射到d正交基函数上的跨越长度为θ的窗口的计算。
在这里插入图片描述
LMU的记忆将输入历史的整个滑动窗口表示为这些比例不变多项式的线性组合。增加维数支持相对于时间尺度的更高频率输入的存储。

2.2 模型设计

在这里插入图片描述

以单个LMU单元举例,模型为一个n维状态矩阵ht动态的加上一个d维的记忆矩阵mt,记忆矩阵代表投射到d勒让德多项式的滑动窗口ut

首先:LMU接受输入向量xt,并生成隐藏状态ht ∈ Rn。每一层都维护自己的隐藏状态向量和内存向量。状态向量与存储向量mt ∈ Rd相互作用,以便在动态写入存储器的同时计算时间上的非线性函数。类似于NRU,隐藏状态向量是输入、先前状态和当前存储器向量的非线性函数的组合:
在这里插入图片描述
f是任何非线性函数(如sin、tanh)。Wx, Wh, Wm是可学习的参数矩阵。
请注意,虽然说隐藏状态ht和记忆状态mt都是利用输入、先前状态和当前存储器向量所得到的,但是其计算方法不同,写入存储器mt的输入信号ut为:
在这里插入图片描述
内核(W)学习计算内存中的非线性函数,而编码器(e)学习将相关信息投射到内存中。

请注意:隐藏状态ht的非线性计算方法已明确,但是存储单元mt还未指明如何得出。给定一些输入ut ∈ R,在离散时刻索引t ∈ N:
在这里插入图片描述
其中(A,B)是ODE求解器在相对于窗口长度θ的某个时间步长t内提供的离散化矩阵。例如,欧拉方法假设t足够小:
在这里插入图片描述
当d=1时,LMU类似于没有门控机制的LSTM,随着d的增加,其相对于频率内容的存储容量也增加。

三、实验数据

3.1 在MNIST上

在这里插入图片描述

3.2 在Mackey-Glass上

Mackey-Glass (MG)数据集是一项时间序列预测任务,用于测试网络模拟混沌动力系统的能力。
在这里插入图片描述

### starRC、LEF 和 DEF 文件的 EDA 工具使用教程 #### 关于 starRC 的使用说明 starRC 是由 Synopsys 开发的一款用于寄生参数提取 (PEX) 的工具,在 detail routing 完成之后被调用,以提供精确的电阻电容延迟分析数据[^2]。该工具能够处理复杂的多层互连结构并支持多种工艺节点。 对于 starRC 的具体操作指南,通常可以从官方文档获取最权威的信息。访问 Synopsys 官方网站的技术资源页面,可以找到最新的产品手册以及应用笔记等资料。此外,还可以通过在线帮助系统获得交互式的指导和支持服务。 #### LEF 和 DEF 文件格式解析及其在 Cadence 中的应用 LEF(Library Exchange Format)和 DEF(Design Exchange Format)是两种广泛应用于集成电路布局布线阶段的标准文件格式之一[^3]。前者主要用于描述标准单元库中的元件几何形状;后者则记录了整个芯片版图的设计信息,包括但不限于各个模块的位置关系、网络连接情况等重要细节。 当涉及到这些文件类型的编辑或读取时,Cadence 提供了一系列强大的平台级解决方案,比如 Virtuoso Layout Editor 就可以直接打开并修改 LEF/DEF 格式的项目工程。为了更好地理解和运用这两种文件格式,建议参阅 Cadence 发布的相关培训材料或是参加其举办的专项课程学习活动。 ```bash # 示例命令:查看 LEF 或 DEF 文件内容 cat my_design.lef cat my_design.def ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值