最近研究了lstm后做的总结

本文探讨了LSTM(长短期记忆网络)的基本结构及其可调整性,指出其核心顺序不可更改,仅可通过细微调整各组件来优化。此外,文章还强调了优化器的学习率对于LSTM的重要性远超过结构调整,并建议在处理序列数据时可结合使用CNN以提升整体表现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

关于lstm的结构是否可变:

    这个结构本身已经很好了,这个意思是你去小改小动无非是去调整lstm中各个部分的作用(只是调整)或是删去某个部分。但你在大致方向上不能做任何改动,这里比如为什么要先用短时那条线去更新长时那条线,而不是先更新短时的线,这个顺序是不能变的(但为什么我自己出个结构就不行呢,实际上你的结构这要在相同参数下结果相似,那已经很了不起了)。所以最后也就是加个peephole,调和遗忘门和输入门,或者改改出入口。


关于lstm的参数:

    每个门有一组权重和偏置,隐藏层和输出长度实际上作用不大,这个结构无论如何都是会收敛的,所以反倒是优化器得学习率是最重要的参数。


所以说以后不应该考虑通过调整lstm结构来获取学术成就,收益很小。


这里说明一下,lstm一般是跑序列的回归或是分类问题,但最终出结果时你需要跑很多个序列,不如把这些序列整合起来用cnn去跑,这样能掩饰单个序列预测上的不足。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值