TensorFlow入门：图执行模式详解与实践-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_01123/article/details/148441216

TensorFlow入门：图执行模式详解与实践

training-data-analyst Labs and demos for courses for GCP Training (http://cloud.google.com/training). 项目地址: https://gitcode.com/gh_mirrors/tr/training-data-analyst

引言

TensorFlow作为当前最流行的深度学习框架之一，提供了两种主要的执行模式：即时执行(Eager Execution)和图执行(Graph Execution)。本文将重点探讨图执行模式的工作原理及其在机器学习模型训练中的应用。

两种执行模式对比

即时执行(Eager Execution)

特点：立即执行操作并返回具体值
优点：直观易用，便于调试，代码简洁
适用场景：原型开发、教学演示

图执行(Graph Execution)

特点：先构建计算图，再在会话中执行
优点：性能优化潜力大，适合分布式训练
适用场景：生产环境、性能敏感型应用

图执行基础

计算图的构建与执行

在图模式下，TensorFlow操作不会立即执行，而是构建一个符号计算图。只有当我们在tf.Session()中运行图时，计算才会真正发生。

a = tf.constant([5, 3, 8], dtype=tf.int32)
b = tf.constant([3, -1, 2], dtype=tf.int32)
c = tf.add(a, b)
print(c)  # 此时仅输出张量信息，不执行计算

with tf.Session() as sess:
    result = sess.run(c)  # 实际计算在此发生
    print(result)  # 输出[8 2 10]

参数化计算图

在实际应用中，我们经常需要动态输入数据。TensorFlow提供了tf.placeholder机制来实现这一点：

a = tf.placeholder(dtype=tf.int32, shape=[None])  
b = tf.placeholder(dtype=tf.int32, shape=[None])
c = tf.add(a, b)

with tf.Session() as sess:
    result = sess.run(c, feed_dict={
        a: [3, 4, 5],
        b: [-1, 2, 3]
    })
    print(result)  # 输出[2 6 8]

线性回归实战

问题定义

我们以简单的线性回归为例，目标是拟合函数：y = 2x + 10

1. 数据准备

X = tf.constant([1,2,3,4,5,6,7,8,9,10], dtype=tf.float32)
Y = 2 * X + 10

2. 模型定义

在TensorFlow中，模型参数需要定义为变量(Variables)，因为它们在训练过程中会被更新：

with tf.variable_scope("training", reuse=tf.AUTO_REUSE):
    w0 = tf.get_variable("w0", initializer=tf.random_normal([]))
    w1 = tf.get_variable("w1", initializer=tf.random_normal([]))
    
Y_hat = w0 * X + w1
loss_mse = tf.reduce_mean((Y_hat - Y)**2)

3. 优化器配置

TensorFlow提供了多种优化算法，这里我们使用梯度下降：

LEARNING_RATE = tf.placeholder(tf.float32, shape=[])
optimizer = tf.train.GradientDescentOptimizer(learning_rate=LEARNING_RATE)

4. 训练循环

STEPS = 1000
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    
    for step in range(STEPS):
        sess.run(optimizer.minimize(loss_mse), 
                 feed_dict={LEARNING_RATE: 0.01})
        
        if step % 100 == 0:
            print("STEP: {} MSE: {}".format(step, sess.run(loss_mse)))
    
    print("Final w0: {:.4f}, w1: {:.4f}".format(
        float(sess.run(w0)), float(sess.run(w1))))

关键概念总结

张量类型：
- 常量张量(tf.constant)：值不可变
- 变量张量(tf.Variable)：值可更新
- 占位符(tf.placeholder)：运行时提供值
计算图执行：
- 先构建计算图，再在会话中执行
- 使用sess.run()执行特定操作
变量作用域：
- 使用tf.variable_scope管理变量命名空间
- 确保变量正确初始化和重用
优化器选择：
- 基础优化器：GradientDescentOptimizer
- 高级优化器：AdamOptimizer, RMSProp等