
NLP
文章平均质量分 95
NLP 相关论文
小毛激励我好好学习
这个作者很懒,什么都没留下…
展开
-
Mamba系列日积月累(一):状态空间模型SSM的离散化过程推导
本文详细推导了状态空间模型的离散化过程。原创 2024-01-30 11:39:18 · 5240 阅读 · 6 评论 -
2017-Attention Is All You Need
在经典的序列翻译模型中,大都是基于RNN和CNN来完成。RNN并行化能力差,CNN捕获远距离依赖的代价较高。基于以上考虑,本文提出了一个仅仅基于Attention机制的Transformer结构,其并行化能力高,同时可以很高效地捕获远距离依赖,克服了RNN和CNN的缺点,成为了NLP领域的标准模型。原创 2021-06-09 13:03:00 · 510 阅读 · 0 评论