FasterTransformer 安装

本文档详细介绍了如何安装FasterTransformer,它支持CUDA10.0。首先,需要下载并安装TensorRT的CUDA10.0对应版本,接着安装pycuda。然后,进行FasterTransformer的安装,包括修改源文件、创建build目录、配置CMake,并解决可能出现的错误,如未知GPU架构、缺少头文件和libtensorflow_framework.so链接问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

第一:安装TensorRT(FasterTransformer 支持cuda10.0,所以TensorRT也下cuda10.0对应版本)

1、下载TensorRT

https://developer.nvidia.com/nvidia-tensorrt-5x-download

2、安装pycuda

pip install pycuda

3、安装 TensorRT

#在home下新建文件夹,命名为tensorrt_tar,然后将下载的压缩文件拷贝进来解压
tar xzvf TensorRT-5.0.2.6.Ubuntu-16.04.4.x86_64-gnu.cuda-9.0.cudnn7.3.tar
 
#解压得到TensorRT-5.0.2.6的文件夹,将里边的lib绝对路径添加到环境变量中
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/lthpc/tensorrt_tar/TensorRT-5.0.2.6/lib
 
#安装TensorRT
cd TensorRT-5.0.2.6/python
#if python2
sudo pip2 install tensorrt-5.0.2.6-py2.py3-none-any.whl
#if python3
sudo pip3 install tensorrt-5.0.2.6-py2.py3-none-any.whl
 
#安装UFF
cd TensorRT-5.0.2.6/uff
#if python2
sudo pip2 install uff-0.5.5-py2.py3-none-any.whl
#if python3
sudo pip3 install uff-0.5.5-py2.py3-none-any.whl
 
#安装graphsurgeon
cd TensorRT-5.0.2.6/graphsurgeon
#if python2
sudo pip2 install graphsurgeon-0.3.2-py2.py3-none-any.whl
#if python3
sudo pip3 install graphsurgeon-0.3.2-py2.py3-none-any.whl

第二:安装 FasterTransformer

1、修改 fastertransformer/common.h 文件

添加: #include <stdexcept> 要不cmake会报错

2、新建build目录

mkdir build

3、cmake

cmake -DCUDA_TOOLKIT_ROOT_DIR=/YOURDIR/cuda/10.0 -DSM=61 -DCMAKE_BUILD_TYPE=Release -DBUILD_TRT=ON -DTRT_PATH=/YOURDIR/TensorRT-5.1.5.0 -DBUILD_TF=ON -DTF_PATH=/YOURDIR/site-packages/tensorflow

其中 YOURDIR 指你自己的路径  、-DSM 要根据自己的gpu确定gpu的算力

4、make 编译

make

 

遇见的错误:

1、

Unknown or unsupported GPU architecture 错误

因为 -DSM  未制定

2、

未添加: #include <stdexcept>

3、make提示没有 libtensorflow_framework.so

可能是用pip安装的tensorflow里面的库命名是 libtensorflow_framework.so.1 , 连接 libtensorflow_framework.so.1到libtensorflow_framework.so

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值