Tensorflow更新一层中的部分参数方法

chutongz

于 2019-07-09 11:09:49 发布

阅读量3.1k

点赞数

CC 4.0 BY-SA版权

分类专栏：原创文章标签： tensorflow 梯度部分更新 gradients

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_41864878/article/details/95175014

本文探讨了在TensorFlow中如何部分更新模型参数，特别是针对embedding层的情况。介绍了`tf.stop_gradients()`的限制及其在损失直接依赖目标张量时的效果。当embedding作为中间层时，建议使用`compute_gradients`和`apply_gradients`结合的方式，通过mask操作来设定要更新的参数部分。通过示例展示了如何验证参数是否成功进行了部分更新。

很多博客都分享了如何不更新某一层的参数，但是当遇到类似于embedding部分更新的情况，就必须局部更新某一层的参数。自己实践之后来分享一下。

tf.stop_gradients()

这个api是可以实现部分更新参数的，参考博客https://blog.youkuaiyun.com/hustchenze/article/details/84672430
但是只有在loss和你的target tensor直接发生关系的时候才能实现，否则会直接阻挡整个层的bp，也就是说如果你想部分更新最后一层的参数，那么用这个api是ok的（这是我个人实际使用的时候发现的，各位可以先做尝试看看）

import tensorflow as tf
import numpy as np
 
def entry_stop_gradients(target, mask):
    mask_h = tf.abs(mask-1)
    return tf.stop_gradient(mask_h * target) + mask * target
 
mask = np.array([1., 0, 1, 1, 0, 0, 1, 1, 0, 1])
mask_h = np.abs(mask-1)
 
emb = tf.constant(np.ones([10, 5]))
 
matrix = entry_stop_gradients(emb, tf.expand_dims(mask,1))
 
parm = np.random.randn(5, 1)
t_parm = tf.constant(parm)

#这里的loss和emb直接相关
loss = tf.reduce_sum(tf.matmul(matrix, t_parm))
grad1 = tf.gradients(loss, emb)
grad2 = tf.gradients(loss, matrix)
with tf.Session() as sess:

最低0.47元/天解锁文章

新学期VIP享超值加赠

博客等级

码龄7年

46
原创

78
点赞

256
收藏

38
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: python写hadoop的MapReduce（以数据按要求合并、重排为例）

下一篇：: Latent Cross: Making Use of Context in Recurrent Recommender Systems 论文阅读

最新评论

NYU-V2数据集预处理
倔强一撮毛: 莫非是（640，480）变为（480， 640）？我猜的我没这么用反正
NYU-V2数据集预处理
Tangyy_123: 您好，我想问一下您这个代码里为什么要进行img.transpose(Image.ROTATE_270)这步操作呢？如果我只是想得到原本的图，是不是可以不进行这一步？
python库pydot运行出现：FileNotFoundError:“dot.exe” not found in path
weixin_45142776: 请问这么修改之后跑出来的全都报错TypeError: argument of type 'NoneType' is not iterable是为什么啊 11 pyd = GraphUtils.to_pydot(Record['G']) ---> 12 tmp_png = pyd.create_png(f="png") 13 fp = io.BytesIO(tmp_png) 14 img = mpimg.imread(fp, format='png') d:\pycharm\python\lib\site-packages\pydot.py in new_method(f, prog, encoding) 1732 """Refer to docstring of method `create`.""" 1733 return self.create( -> 1734 format=f, prog=prog, encoding=encoding) 1735 name = 'create_{fmt}'.format(fmt=frmt) 1736 self.__setattr__(name, new_method) d:\pycharm\python\lib\site-packages\pydot.py in create(self, prog, format, encoding) 1928 program=prog, 1929 arguments=arguments, -> 1930 working_dir=tmp_dir, 1931 ) 1932 except OSError as e: d:\pycharm\python\lib\site-packages\pydot.py in call_graphviz(program, arguments, working_dir, **kwargs)
Ubuntu16.04搭建GTX1080+CUDA9.0+cuDNN7.0.5+Tensorflow1.6.0环境
GladyoUcaMe: “有一个关键是会让你选择是否安装Graphics Driver for Linux-x86_64：XXXX版本，这个地方必须选择no！否则会覆盖之前的驱动” 这个地方必须选择yes，覆盖之前的驱动，会有什么影响呢？
DRN: A Deep Reinforcement Learning Framework for News Recommendation理解
panbaoran913: 有类似的论文推荐吗

大家在看

最新文章

目录

展开全部

收起

评论 17

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。