TensorFlow基础

部署运行你感兴趣的模型镜像

使用 TensorFlow, 你必须明白 TensorFlow:

  • 使用图 (graph) 来表示计算任务.
  • 在被称之为 会话 (Session) 的上下文 (context) 中执行图.
  • 使用 tensor 表示数据.
  • 通过 变量 (Variable) 维护状态.
  • 使用 feed 和 fetch 可以为任意的操作(arbitrary operation) 赋值或者从其中获取数据.

综述

TensorFlow 是一个编程系统, 使用图来表示计算任务. 图中的节点被称之为 op (operation 的缩写). 一个 op 获得 0 个或多个 Tensor, 执行计算, 产生 0 个或多个 Tensor. 每个 Tensor 是一个类型化的多维数组. 例如, 你可以将一小组图像集表示为一个四维浮点数数组, 这四个维度分别是 [batch, height, width, channels].

一个 TensorFlow 图描述了计算的过程. 为了进行计算, 图必须在 会话 里被启动. 会话 将图的 op 分发到诸如 CPU 或 GPU 之类的 设备 上, 同时提供执行 op 的方法. 这些方法执行后, 将产生的 tensor 返回. 在 Python 语言中, 返回的 tensor 是 IPython 之类的 Python 交互环境, 可以使用 InteractiveSession 代替 Session 类, 使用Tensor.eval() 和 Operation.run() 方法代替 Session.run(). 这样可以避免使用一个变量来持有会话.

# 进入一个交互式 TensorFlow 会话.
import tensorflow as tf
sess = tf.InteractiveSession()

x = tf.Variable([1.0, 2.0])
a = tf.constant([3.0, 3.0])

# 使用初始化器 initializer op 的 run() 方法初始化 'x' 
x.initializer.run()

# 增加一个减法 sub op, 从 'x' 减去 'a'. 运行减法 op, 输出结果 
sub = tf.sub(x, a)
print sub.eval()
# ==> [-2. -1.]

Tensor

TensorFlow 程序使用 tensor 数据结构来代表所有的数据, 计算图中, 操作间传递的数据都是 tensor. 你可以把 TensorFlow tensor 看作是一个 n 维的数组或列表. 一个 tensor 包含一个静态类型 rank, 和 一个 shape. 想了解 TensorFlow 是如何处理这些概念的, 参见 Rank, Shape, 和 Type.

变量

Variables for more details. 变量维护图执行过程中的状态信息. 下面的例子演示了如何使用变量实现一个简单的计数器. 参见 变量 章节了解更多细节.

# 创建一个变量, 初始化为标量 0.
state = tf.Variable(0, name="counter")

# 创建一个 op, 其作用是使 state 增加 1

one = tf.constant(1)
new_value = tf.add(state, one)
update = tf.assign(state, new_value)

# 启动图后, 变量必须先经过`初始化` (init) op 初始化,
# 首先必须增加一个`初始化` op 到图中.
init_op = tf.initialize_all_variables()

# 启动图, 运行 op
with tf.Session() as sess:
  # 运行 'init' op
  sess.run(init_op)
  # 打印 'state' 的初始值
  print sess.run(state)
  # 运行 op, 更新 'state', 并打印 'state'
  for _ in range(3):
    sess.run(update)
    print sess.run(state)

# 输出:

# 0
# 1
# 2
# 3

代码中 assign() 操作是图所描绘的表达式的一部分, 正如 add() 操作一样. 所以在调用 run() 执行表达式之前, 它并不会真正执行赋值操作.

通常会将一个统计模型中的参数表示为一组变量. 例如, 你可以将一个神经网络的权重作为某个变量存储在一个 tensor 中. 在训练过程中, 通过重复运行训练图, 更新这个 tensor.

Fetch

为了取回操作的输出内容, 可以在使用 Session 对象的 run() 调用 执行图时, 传入一些 tensor, 这些 tensor 会帮助你取回结果. 在之前的例子里, 我们只取回了单个节点 state, 但是你也可以取回多个 tensor:

input1 = tf.constant(3.0)
input2 = tf.constant(2.0)
input3 = tf.constant(5.0)
intermed = tf.add(input2, input3)
mul = tf.mul(input1, intermed)

with tf.Session() as sess:
  result = sess.run([mul, intermed])
  print result

# 输出:
# [array([ 21.], dtype=float32), array([ 7.], dtype=float32)]

需要获取的多个 tensor 值,在 op 的一次运行中一起获得(而不是逐个去获取 tensor)。

Feed

上述示例在计算图中引入了 tensor, 以常量或变量的形式存储. TensorFlow 还提供了 feed 机制, 该机制 可以临时替代图中的任意操作中的 tensor 可以对图中任何操作提交补丁, 直接插入一个 tensor.

feed 使用一个 tensor 值临时替换一个操作的输出结果. 你可以提供 feed 数据作为 run() 调用的参数. feed 只在调用它的方法内有效, 方法结束, feed 就会消失. 最常见的用例是将某些特殊的操作指定为 "feed" 操作, 标记的方法是使用 tf.placeholder() 为这些操作创建占位符.


input1 = tf.placeholder(tf.float32)
input2 = tf.placeholder(tf.float32)
output = tf.mul(input1, input2)

with tf.Session() as sess:
  print sess.run([output], feed_dict={input1:[7.], input2:[2.]})

# 输出:
# [array([ 14.], dtype=float32)]

如果没有正确提供 feed, placeholder() 操作将会产生错误。MNIST 全连通feed 教程给出了一个更大规模的使用 feed 的例子。

您可能感兴趣的与本文相关的镜像

TensorFlow-v2.15

TensorFlow-v2.15

TensorFlow

TensorFlow 是由Google Brain 团队开发的开源机器学习框架,广泛应用于深度学习研究和生产环境。 它提供了一个灵活的平台,用于构建和训练各种机器学习模型

### TensorFlow 基础 API 文档与教程 #### 获取并安装 TensorFlow 为了使用 TensorFlow基础 API,首先需要确保已正确安装 TensorFlow 库。可以通过 pip 工具来完成安装操作: ```bash pip install tensorflow ``` 对于希望利用 GPU 加速计算环境的开发者来说,则需特别注意版本兼容性以及驱动程序的要求。 #### 导入 TensorFlow 模块 成功安装之后,在 Python 脚本或交互环境中导入 TensorFlow 是必不可少的第一步[^4]: ```python import tensorflow as tf ``` 这一步骤使得后续可以方便地调用 TensorFlow 提供的各种功能函数和类定义。 #### 使用常量与变量 TensorFlow 中的数据主要以张量的形式存在。创建一个简单的常量可以直接通过 `tf.constant` 函数实现: ```python hello_world = tf.constant('Hello, TensorFlow!') print(hello_world.numpy()) # 输出: Hello, TensorFlow! ``` 而当涉及到模型参数或其他可能变化的数据时,则应该考虑使用变量 Variable 来表示它们。Variable 对象允许被更新,并且能够自动追踪梯度信息以便于反向传播过程中的优化处理。 ```python w = tf.Variable([0.5], dtype=tf.float32) b = tf.Variable([-0.7], dtype=tf.float32) # 更新 w 和 b 的值 w.assign_add(0.1) b.assign_sub(0.1) ``` #### 构建简单线性回归模型 构建机器学习模型通常涉及定义前向传播路径(即如何从输入得到预测输出)。下面是一个非常基础的例子——单特征线性回归模型的搭建方式: ```python def linear_model(x): return w * x + b ``` 这里假设权重 \(w\) 和偏置项 \(b\) 都已经被初始化为 Variables 类型的对象;给定任意实数类型的输入 \(x\) 后即可获得相应的估计结果。 #### 计算损失函数 为了让模型学会调整内部参数从而更好地拟合数据集,还需要引入衡量误差大小的标准—损失函数 Loss Function。均方差 MSE (Mean Squared Error) 就是一种常用的选择之一: ```python loss_function = lambda y_true, y_pred: tf.reduce_mean(tf.square(y_true - y_pred)) ``` 此表达式接收真实标签值 `y_true` 及由上述线性组合产生的预测得分 `y_pred` ,返回两者之间差异平方平均值得到最终评估指标 score。 #### 执行训练循环 最后便是反复迭代整个流程直至收敛的过程了。每次读取一批次样本点喂给网络做正向推理的同时记录下当前时刻累积下来的总代价 cost 。接着借助选定好的最优化算法 Optimize Algorithm (比如随机梯度下降 SGD 或 Adam),依据链式法则 Chain Rule 自动求导机制推导出各层节点关于目标函数敏感程度的变化趋势 gradient 并据此修正连接权系数 weights 。 ```python optimizer = tf.optimizers.Adam() for epoch in range(num_epochs): with tf.GradientTape() as tape: predictions = linear_model(features) loss_value = loss_function(labels, predictions) gradients = tape.gradient(loss_value, [w,b]) optimizer.apply_gradients(zip(gradients,[w,b])) ``` 以上就是基于 TensorFlow 实现的一个完整的端到端工作流概述[^1]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值