tensorflow编程基础

本文介绍了深度学习框架中的核心概念,包括张量、变量、占位符等,并详细解释了session与图的交互过程中的数据流向机制。此外,还提供了模型保存和加载的具体实现示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

模型构建中的几个概念。张量:数据,即某一类型的多维数组。变量:常用于定义模型中的参数,是通过不断训练得到的值。占位符:输入变量的载体,也可以理解为定义函数时的参数。图中的节点操作(OP):即一个OP获得0个或者多个tensor,执行计算输出额外的0个或多个tensor。在python中,返回的tensor是numpy.ndarray对象。

在具体的项目中,会有三种应用场景,分别是训练场景、测试场景和使用场景。训练场景是实现模型从无到有的过程,通过对样本的学习训练,调整学习参数,形成最终的模型。测试场景和使用场景:测试场景是利用图的正向运算得到的结果与真实值进行比较的差别;使用场景也是利用图的正向运算得到结果,并直接使用。二者的运算过程是一样的。这个过程特别像普通编程中使用函数的过程:实参就是输入的样本,形参就是占位符,运算过程就相当于函数体,得到的结果相当于返回值。

session与图的交互过程中还定义了以下两种数据的流向机制。注入机制(feed):通过占位符向模式中传入数据;取回机制(fetch):从模式中得到结果。

演示注入机制:需要注意的是,feed只在调用它的方法内有效,方法结束后feed就会消失。代码如下所示:

import tensorflow as tf
a=tf.placeholder(tf.int16)
b=tf.placeholder(tf.int16)
add=tf.add(a,b)
mul=tf.multiply(a,b)
with tf.Session() as sess:
    print("相加:%i" % sess.run(add,feed_dict={a:3,b:4}))
    print('相乘:%i' % sess.run(mul,feed_dict={a:3,b:5}))

保存和载入模型

saver=tf.train.Saver()
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    ....
    saver.save(sess,'save_patch+filename')

需要注意的是,save_patch的路径要在session的创建之前,模型保存在代码的同级目录下。而载入模型则通过在session中调用saver的restore()函数,从指定的路径找到对应名称的模型。除了在训练结束以后,在训练中也可以保存模型。这样当训练模型出现中断时,可以得到保存到的中间参数,习惯称之为保存检查点。

import tensorflow as tf
import numpy as np
import os
os.environ["TF_CPP_MIN_LOG_LEVEL"]='2'
train_X=np.linspace(-1,1,100)
train_Y=2*train_X+np.random.randn(100)*0.3
X=tf.placeholder('float')
Y=tf.placeholder('float')
W=tf.Variable(tf.random_normal([1]),name='weight')
b=tf.Variable(tf.zeros([1]),name='bias')
z=tf.multiply(X,W)+b
cost=tf.reduce_mean(tf.square(z-Y))
learning_rate=0.01
optimizer=tf.train.GradientDescentOptimizer(learning_rate).minimize(cost)
initial=tf.global_variables_initializer()
training_epoch=20
display_step=2
saver=tf.train.Saver(max_to_keep=1)
savedir='log/'
with tf.Session() as sess:     
    sess.run(initial)
    for epoch in range(training_epoch):
        for (x,y) in zip(train_X,train_Y):
            sess.run(optimizer,feed_dict={X:x,Y:y})
        if epoch % display_step ==0:
            loss=sess.run(cost,feed_dict={X:x,Y:y})
            print('epoch:',epoch+1,'loss:',loss,'W:',sess.run(W),'b:',sess.run(b))
            saver.save(sess,savedir+'linermodule.cpkt',global_step=epoch)
    print('finished')
    print('loss:',sess.run(cost,feed_dict={X:x,Y:y}),'w:',sess.run(W),'b:',sess.run(b))
load_epoch=18
with tf.Session() as sess2:
    sess2.run(tf.global_variables_initializer())
    saver.restore(sess2,savedir+'linermodule.cpkt-'+str(load_epoch))
    print('x=0.2,z=',sess2.run(z,feed_dict={X:0.2}))

保存的检查点文件如下所示:

因为设置max_to_keep=1,所以在迭代的过程中只保存一个文件。在训练的过程中,新生成的模型会覆盖以前的模型。

运行结果如下图所示:

 

### TensorFlow 编程教程和资源 #### 初步认识 TensorFlow TensorFlow 是由 Google 开发的一个开源机器学习框架,支持多种类型的机器学习算法。对于初学者来说,理解其基本概念至关重要[^1]。 #### 安装与环境配置 为了顺利运行 TensorFlow 程序,在本地计算机上安装合适的开发环境非常重要。通常建议通过 Anaconda 创建虚拟环境来管理依赖项,并按照官方文档导完成 TensorFlow 的安装过程[^3]: ```bash source activate tensorflow ``` 这行命令用于激活预先设置好的名为 `tensorflow` 的 Conda 虚拟环境,使得在此环境下执行的所有 Python 命令都将优先使用该环境中定义的包版本。 #### 学习路径推荐 针对不同层次的学习者,提供了多样化的学习材料: - **基础入门**:可以从 TensorFlow 官方网站提供的交互式 Colab 笔记本开始探索,这些笔记本涵盖了从零构建神经网络的基础知识。 - **中级提升**:随着技能的增长,可以深入研究特定领域如图像分类、文本处理等方面的高级主题。例如,利用 Keras API 实现卷积神经网络(CNN),并应用于实际项目中解决真实世界的问题。 - **专家级掌握**:当具备一定经验之后,则可以通过阅读源码或者参与社区贡献等方式进一步加深对整个系统的理解和优化能力。 #### 关键特性介绍 在 TensorFlow 中,张量(Tensor)作为核心数据结构被广泛运用。相比于传统数组或矩阵,它能够表示更高维度的数据集,并且可以在 CPU/GPU 上高效计算。此外,自动求导机制极大地方便了反向传播过程中梯度的计算工作[^2]。 #### 示例代码展示 下面给出一段简单的 TensorFlow 代码片段,展示了如何定义变量以及执行基本算术运算: ```python import tensorflow as tf a = tf.constant(2) b = tf.constant(3) print(f"a + b = {tf.add(a, b)}") # 输出 a+b=5 ``` 这段程序首先导入必要的库文件,接着声明两个常数节点 `a` 和 `b` ,最后调用加法函数并将结果打印出来。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值