bazel编译tensorflow源码

最新推荐文章于 2023-02-24 10:48:12 发布

原创

最新推荐文章于 2023-02-24 10:48:12 发布 · 7.8k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#tensorflow #python

本文详细记录了在CentOS 7.5上手动编译TensorFlow 1.12.0以启用CPU的AVX2指令集优化的过程，包括安装bazel、配置、编译源码、生成whl安装包等步骤。尽管最终性能提升并不显著，但作者通过jmeter压测发现有轻微提升。过程中遇到了如nosuchpackage、C++编译错误等问题，均提供了解决方案。

在安装完tensorflow CPU版本后，经常看到如下的警告，该警告虽说可以通过一些python语句来忽略(忽略方法)，但总有点眼不见为净的感觉。

Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2 FMA

该警告本质上是说由于机器的CPU支持AVX2的优化，但是安装的tensorflow包没有利用该优化。另一种解决该警告的方式是自己手动编译tensorflow安装包。

自己手动编译tensorflow，解决该警告只是附加效果，更主要的是笔者想借此机会测试看看利用AVX2优化后的tensorflow到底比没有优化的快多少，因此，才有了本篇踩坑记录~

先说结论吧，利用jmeter压测工具测试发现，优化后性能并没有提升多少，但总体来说还是稍微有些提升，因此AVX2优化多多少少还是有些效果的，具体效果值不值那就自己掂量了~

优化前，5s内调用接口性能指标
优化后，5s内调用接口性能指标

下面开始记录踩坑过程~

0.环境

CentOS Linux release 7.5.1804 (Core)
tensorflow 1.12.0
gcc 版本 4.8.5 20150623 (Red Hat 4.8.5-28) (GCC)
python 3.6.8
bazel

最低0.47元/天解锁文章

评论 4

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。