TensorFlow运行

1. 显示调用Session生成及关闭函数:

import tensorflow as tf

x1 = tf.constant([2, 3, 4])
x2 = tf.constant([4, 0, 1])
y = tf.add(x1, x2)

sess = tf.Session()
print (sess.run(y))
sess.close() #需要关闭会话以释放本次运行中使用到的资源

2. 通过Python的上下文管理器来使用会话:

import tensorflow as tf

x1 = tf.constant([2, 3, 4])
x2 = tf.constant([4, 0, 1])
y = tf.add(x1, x2)

with tf.Session() as sess:
    print (sess.run(y))
#上下文退出时会自动关闭会话和释放资源

3. 设置默认会话

import tensorflow as tf

x1 = tf.constant([2, 3, 4])
x2 = tf.constant([4, 0, 1])
y = tf.add(x1, x2)

sess = tf.InteractiveSession() #自动将生成的会话注册为默认会话
print(y.eval()) #等价于 print(sess.run(y))
sess.close()

手动指定默认会话:

sess = tf.Session()
with sess.as_default():
    print(sess.run(y))

指定了默认会话之后,便可使用tensor.eval()来运行

### 解决 TensorFlow 运行时与 AVX 指令集相关的兼容性或性能问题 #### 使用预编译的 TensorFlow 轮子提高兼容性和性能 为了确保 TensorFlow 可以利用现代 CPU 的高级矢量化扩展(如 AVX 和 FMA),可以考虑使用经过优化的 TensorFlow 预编译轮子。这些轮子由第三方维护者构建,旨在最大化不同硬件平台上的性能表现[^1]。 ```bash pip install --upgrade pip pip install tensorflow==1.12.0 -f https://gitcode.com/gh_mirrors/te/tensorflow-optimized-wheels ``` 上述命令安装了一个特别针对具备 AVX2 支持的 CPU 架构做了优化的 TensorFlow 版本,从而提高了计算密集型任务的速度和效率[^2]。 #### 修改 TensorFlow 编译选项增强指令集支持 如果希望进一步定制 TensorFlow 对特定 CPU 功能的支持程度,则可以通过自定义源码来实现这一点。具体来说,在配置阶段启用相应的标志位能够使最终生成的应用程序更好地适应底层硬件环境: ```shell ./configure # 当提示输入 CXX OPTS 时加入如下参数: -D_GLIBCXX_USE_CXX11_ABI=0 \ -march=native \ -O3 \ -funroll-loops \ -ftree-vectorize \ -finline-functions-called-once \ -flto \ -Wno-sign-compare bazel build --config=opt //tensorflow/tools/pip_package:build_pip_package ``` 这里 `-march=native` 参数指示编译器尽可能多地利用本地系统的特殊功能,包括但不限于 AVX、FMA 等向量运算单元;其他优化标记也有助于减少不必要的开销并加快执行过程[^4]。 #### 利用 TensorRT 或 OpenVINO 工具包改善推理效能 除了调整软件层面的因素外,还可以借助 NVIDIA 提供的 TensorRT 或 Intel 推出的 OpenVINO™ Toolkit 来加速模型部署后的实际运行效果。这两个工具都专注于降低延迟时间以及增加吞吐率,尤其适合那些对实时响应有较高需求的服务端应用场合[^3]。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值