Tensorflow通常构建步骤:
构建计算图:
1. 定义输入和输出的占位符
2. 定义模型中需要用到的权重
3. 定义推断模型,构建网络
4. 定义损失函数作为优化对象
5. 定义优化器进行优化
执行计算图:
1. 第一次进行运算的时候,初始化模型的所有参数
2. 传入训练数据,可以打乱顺序
3. 网络前向传播,计算出当前参数下的网络输出
4. 根据网络输出和目标计算出loss
5. 通过loss反向传播更新网络中的参数
InteractiveSession:
Tensorflow依赖于一个高效的C++后端来进行计算。与后端的这个连接叫做session。一般而言,使用TensorFlow程序的流程是先创建一个图,然后在session中启动它。
这里,我们使用更加方便的InteractiveSession
类。通过它,你可以更加灵活地构建你的代码。它能让你在运行图的时候,插入一些计算图,这些计算图是由某些操作(operations)构成的。这对于工作在交互式环境中的人们来说非常便利,比如使用IPython。如果你没有使用InteractiveSession
,那么你需要在启动session之前构建整个计算图,然后启动该计算图。