bazel编译tensorflow源码

本文详细记录了在CentOS 7.5上手动编译TensorFlow 1.12.0以启用CPU的AVX2指令集优化的过程,包括安装bazel、配置、编译源码、生成whl安装包等步骤。尽管最终性能提升并不显著,但作者通过jmeter压测发现有轻微提升。过程中遇到了如nosuchpackage、C++编译错误等问题,均提供了解决方案。

在安装完tensorflow CPU版本后,经常看到如下的警告,该警告虽说可以通过一些python语句来忽略(忽略方法),但总有点眼不见为净的感觉。

Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2 FMA

该警告本质上是说由于机器的CPU支持AVX2的优化,但是安装的tensorflow包没有利用该优化。另一种解决该警告的方式是自己手动编译tensorflow安装包。

自己手动编译tensorflow,解决该警告只是附加效果,更主要的是笔者想借此机会测试看看利用AVX2优化后的tensorflow到底比没有优化的快多少,因此,才有了本篇踩坑记录~

先说结论吧,利用jmeter压测工具测试发现,优化后性能并没有提升多少,但总体来说还是稍微有些提升,因此AVX2优化多多少少还是有些效果的,具体效果值不值那就自己掂量了~

优化前,5s内调用接口性能指标
优化后,5s内调用接口性能指标

下面开始记录踩坑过程~

0.环境

CentOS Linux release 7.5.1804 (Core)
tensorflow 1.12.0
gcc 版本 4.8.5 20150623 (Red Hat 4.8.5-28) (GCC)
python 3.6.8
bazel

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值