Tensorflow：tf.gradient()用法以及参数stop_gradient理解

最新推荐文章于 2024-01-14 10:27:22 发布

原创最新推荐文章于 2024-01-14 10:27:22 发布 · 1.1w 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#tensorflow #gradient #stop_gradient

Tensorflow 专栏收录该内容

8 篇文章

订阅专栏

本文深入解析了TensorFlow中tf.gradients函数的使用方法，详细介绍了如何通过该函数进行微分计算，包括参数ys、xs及stop_gradients的具体作用。通过实例演示了不同参数设置下梯度计算的变化，帮助读者理解反向传播过程。

部署运行你感兴趣的模型镜像

tf.gradient()

tf.gradients(
    ys,
    xs,
    grad_ys=None,
    name='gradients',
    colocate_gradients_with_ops=False,
    gate_gradients=False,
    aggregation_method=None,
    stop_gradients=None
)

ys : 类型是张量或者张量列表，类似于目标函数，需要被微分的函数
xs：类型是张量或者张量列表，需要求微分的对象。（上述即为:dys/dxs）
stop_gradients: 可选参数，类型是张量或者张量列表，不需要通过微分的对象（比较抽象，看完下面的例子）

用一个例子来帮助理解

a = tf.constant(0.)
b = 2 * a
g = tf.gradients(a + b, [a, b])
with tf.Session() as sess:
    print(sess.run(g))
结果:[3.0, 1.0]

a = tf.constant(0.)
b = 2 * a
g = tf.gradients(a + b, [a, b], stop_gradients=[a])
with tf.Session() as sess:
    print(sess.run(g))
结果:[3.0, 1.0]

a = tf.constant(0.)
b = 2 * a
g = tf.gradients(a + b, [a, b], stop_gradients=[b])
with tf.Session() as sess:
    print(sess.run(g))
结果:[1.0, 1.0]