在安装完tensorflow CPU版本后,经常看到如下的警告,该警告虽说可以通过一些python语句来忽略(忽略方法),但总有点眼不见为净的感觉。
Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2 FMA
该警告本质上是说由于机器的CPU支持AVX2的优化,但是安装的tensorflow包没有利用该优化。另一种解决该警告的方式是自己手动编译tensorflow安装包。
自己手动编译tensorflow,解决该警告只是附加效果,更主要的是笔者想借此机会测试看看利用AVX2优化后的tensorflow到底比没有优化的快多少,因此,才有了本篇踩坑记录~
先说结论吧,利用jmeter压测工具测试发现,优化后性能并没有提升多少,但总体来说还是稍微有些提升,因此AVX2优化多多少少还是有些效果的,具体效果值不值那就自己掂量了~


下面开始记录踩坑过程~
0.环境
CentOS Linux release 7.5.1804 (Core)
tensorflow 1.12.0
gcc 版本 4.8.5 20150623 (Red Hat 4.8.5-28) (GCC)
python 3.6.8
bazel

本文详细记录了在CentOS 7.5上手动编译TensorFlow 1.12.0以启用CPU的AVX2指令集优化的过程,包括安装bazel、配置、编译源码、生成whl安装包等步骤。尽管最终性能提升并不显著,但作者通过jmeter压测发现有轻微提升。过程中遇到了如nosuchpackage、C++编译错误等问题,均提供了解决方案。
最低0.47元/天 解锁文章
5362

被折叠的 条评论
为什么被折叠?



