TensorFlow基础教程：变量创建与初始化详解-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00991/article/details/148375796

TensorFlow基础教程：变量创建与初始化详解

TensorFlow-Course :satellite: Simple and ready-to-use tutorials for TensorFlow 项目地址: https://gitcode.com/gh_mirrors/tenso/TensorFlow-Course

前言

在TensorFlow中，变量(Variables)是构建机器学习模型的核心组件之一。本教程将深入讲解TensorFlow变量的创建、初始化机制及其在计算图中的运作原理。掌握这些基础知识对于后续构建复杂神经网络模型至关重要。

变量(Variables)的本质与作用

TensorFlow变量本质上是一种特殊的张量(Tensor)，它具有以下关键特性：

持久化存储：变量在计算图执行过程中保持其状态，这与普通张量不同
可训练性：模型参数(如权重和偏置)通常存储为变量，以便在训练过程中更新
共享性：变量可以在计算图的不同部分共享使用

变量必须经过初始化才能使用，这类似于在传统编程中声明变量后需要赋初值。

变量的创建方法

在TensorFlow中，我们使用tf.Variable()类来创建变量。创建变量时通常需要指定：

初始值(可以是任意Tensor)
变量名称(可选，用于调试和可视化)
数据类型(可选，默认为初始值的类型)
其他特性如可训练性等

创建示例

import tensorflow as tf
from tensorflow.python.framework import ops

# 创建随机初始化的权重变量
weights = tf.Variable(tf.random_normal([2, 3], stddev=0.1), name="weights")

# 创建零初始化的偏置变量
biases = tf.Variable(tf.zeros([3]), name="biases")

# 创建自定义变量
custom_var = tf.Variable(tf.zeros([3]), name="custom")

# 获取图中所有变量
all_vars = ops.get_collection(ops.GraphKeys.GLOBAL_VARIABLES)

这里ops.get_collection(ops.GraphKeys.GLOBAL_VARIABLES)可以获取当前计算图中定义的所有变量，这在需要批量操作变量时非常有用。

变量的初始化策略

变量初始化是TensorFlow编程中的关键步骤，不当的初始化会导致模型无法正常工作。TensorFlow提供了多种初始化方式：

1. 全局初始化

最常用的方式是使用tf.global_variables_initializer()，它会初始化计算图中的所有变量：

init_all = tf.global_variables_initializer()

这相当于：

init_all = tf.variables_initializer(var_list=all_vars)

2. 自定义初始化

有时我们只需要初始化部分变量：

# 只初始化weights和custom_var
custom_init = tf.variables_initializer(var_list=[weights, custom_var])

3. 基于已有变量初始化

新变量可以基于已有变量的初始值进行初始化：

# 基于weights的初始值创建新变量
weights_new = tf.Variable(weights.initialized_value(), name="weights_new")
weights_new_init = tf.variables_initializer(var_list=[weights_new])

这种方式在需要创建与现有变量结构相同的新变量时非常有用。

变量初始化的执行

在TensorFlow中，定义初始化操作只是将其添加到计算图中，真正的初始化需要在会话(Session)中执行：

with tf.Session() as sess:
    # 执行全局初始化
    sess.run(init_all)
    
    # 执行自定义初始化
    sess.run(custom_init)
    
    # 执行基于现有变量的初始化
    sess.run(weights_new_init)

注意初始化操作的执行顺序很重要，特别是当某些初始化依赖于其他变量时。