0718学习日志

  1. GRU结构相对于LSTM结构更加的简单,它在保证长期记忆性能的同时去除了一条记忆通道,并将三个门融合为两个,大大地减少了参数,显著提升了运算性能,缩短了时空成本,并在一定程度上防止了过拟合

  1. 动态计算图和静态计算图是深度学习框架中两种不同的计算图构建方式。

静态计算图先定义计算图的结构(如节点和边),然后再传入数据进行计算。计算图在运行前就已经固定,类似于编译型语言。

动态计算图在运行时动态构建计算图,每执行一行代码就实时生成对应的计算图结构,类似于解释型语言。

静态图适合追求极致性能的生产环境,而动态图更适合灵活的研究和开发

  1. LSTM 虽然通过门控机制(输入门、遗忘门、输出门)在一定程度上缓解了梯度消失问题,能够比普通 RNN 更好地处理长距离依赖关系,但它并不能完全杜绝梯度消失和梯度爆炸问题,尤其是在处理超长序列时。此时截断式反向传播仍然起到显著作用,其通过将长序列截断成较短的子序列进行训练,减少计算量,并缓解梯度问题,使得模型得到有效训练和同时降低计算成本。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值