基于tensorflow如何对变化中的学习率实现与之相关的梯度裁剪-VDSR-优快云博客

本文深入探讨了深度学习训练过程中的关键技巧，包括学习率衰减策略的设置与应用，以及如何通过梯度裁剪有效避免梯度爆炸问题，确保模型稳定收敛。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

# NOTE: learning rate decay
        global_step = tf.Variable(0, trainable=False)
        #learning_rate = tf.train.exponential_decay(config.learning_rate, global_step * config.batch_size, len(input_)*100, 0.1, staircase=True)
        learning_rate = tf.train.exponential_decay(config.learning_rate, global_step , 10, 0.1, staircase=True)#自己设就行
        # NOTE: Clip gradient
        #代码修改 在这里我们输入的learning_rate为自适应变化的 对应论文中梯度裁剪的大小也不同
        #opt = tf.train.AdamOptimizer(learning_rate=self.learning_rate)
        opt = tf.train.AdamOptimizer(learning_rate=learning_rate)
        #lr  = opt._lr

        grad_and_value = opt.compute_gradients(self.loss)

        clip = tf.Variable(config.clip_grad, name='clip')
        clip = config.clip_grad/learning_rate
        capped_gvs = [(tf.clip_by_value(grad, -(clip), clip), var) for grad, var in grad_and_value]
        #小于-clip的等于-clip 大于的等于clip
        self.train_op = opt.apply_gradients(capped_gvs, global_step=global_step)#将计算出的梯度应用到变量上，是函数minimize()的第二部分
        #self.train_op = tf.train.AdamOptimizer(learning_rate=config.learning_rate).minimize(self.loss)

当时还发现自己因为是输出对象和输入对象重名出现了问题。对应输出代码如下：

  # Train
        if not config.is_train:
            print("Now Start Training...")
            for ep in range(config.epoch):
                # Run by batch images
                batch_idxs = len(input_) // config.batch_size
                #for idx in range(0, batch_idxs):
                for idx in range(0, 4):
                    #print(lr)
                    batch_images = input_[idx * config.batch_size : (idx + 1) * config.batch_size]
                    batch_labels = label_[idx * config.batch_size : (idx + 1) * config.batch_size]
                    counter += 1
                    #print(self.sess.run(lr))
                    _, err,clipduan = self.sess.run([self.train_op, self.loss,clip], feed_dict={self.images: batch_images, self.labels: batch_labels})
                    ####注意这个地方 前面的名字和后面对应的名字不能一样 否则会触发报错
                    if counter % 3 == 0:
                        print("Epoch: [%2d], step: [%2d], time: [%4.4f], loss: [%.8f]" % ((ep+1), counter, time.time()-time_, err ))
                        print(clipduan)
                    #if counter % 500 == 0:
                        self.save(config.checkpoint_dir, counter)