tensorflow踩坑记录

最新推荐文章于 2024-11-14 10:36:55 发布

原创最新推荐文章于 2024-11-14 10:36:55 发布 · 479 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#tensorflow #GPU

博主在寒假期间学习TensorFlow并搭建网络进行训练，分享了ResourceExhaustedError和ValueError的解决经验，特别是在搭建双向LSTM网络时遇到的变量重复问题及其解决方法。

部署运行你感兴趣的模型镜像

为了下学期的实验做准备，我在寒假学习了tensorflow，边学边搭建网络进行训练。在学习的路上踩了不少坑，但是总体还算顺利。这些坑中，除了网络本身的bug和tf语法错误，还有几个特别要注意的异常。

ResourceExhaustedError

这个异常表示资源耗尽，通常指在为参数变量申请内存（显存）时，剩余可用空间不足。解决办法主要有三条思路

使用CPU训练
减少网络的参数变量
减小batch_size、词向量维度、网络层数、神经元个数
使用更好的GPU

ValueError: Variable rnn/basic_lstm_cell/kernel already exists, disallowed.

我在搭建双向lstm网络时遇到此问题。
forward_lstm_cell = tf.contrib.rnn.BasicLSTMCell(lstm_size)
backward_lstm_cell = tf.contrib.rnn.BasicLSTMCell(lstm_size)
在网上查了异常，坑友都指出此异常与变量作用域有关，但是解决方案都不一样，包括使用with tf.variable_scope(name):pass来定义作用域，还有在代码中添加t f.reset_default_graph()。
具体的原理我暂时没有探究。我试着为这两层网络分别添加名称，问题解决。
forward_lstm_cell = tf.contrib.rnn.BasicLSTMCell(lstm_size, name = 'forward_lstm_cell')
backward_lstm_cell = tf.contrib.rnn.BasicLSTMCell(lstm_size, name = 'backward_lstm_cell')

您可能感兴趣的与本文相关的镜像

TensorFlow-v2.15

TensorFlow-v2.15

TensorFlow

TensorFlow 是由Google Brain 团队开发的开源机器学习框架,广泛应用于深度学习研究和生产环境。它提供了一个灵活的平台,用于构建和训练各种机器学习模型

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。