11月21、22两天参加了苏州的NVIDIA GTC 2018大会,各大厂商把TensorRT 用的神乎其神,京东无人柜在TRT的加成之下,模型能搞提升一倍,效果可观。
1. CUDA / CUDNN 版本修改
TensorRT5 的安装依赖 cuda 9.0 和 cuDNN 7.3.1 所以我矫枉过正,把cuda 9.2 拉回到了 cuda 9.0,并重新配置了 cuDNN。
此外我按照
路径是: /usr/lib/x86_64-linux-gnu/libcudnn.so.7 -> libcudnn.so.7.3.1
这个安装过程相对简单,不再赘述。
2. pycuda 安装
我的环境是Ubuntu16.04,因为依赖装得比较多,所以这个很简单,一条命令搞定了 pip3 install pycuda
,详细过程可以参考下面。
https://wiki.tiker.net/PyCuda/Installation/Linux/Ubuntu
另:
由于公司内部各个python版本共用一个 pip3 ,所以为了安装到指定的 python3.5 目录下,是通过
pip3.5 install -t /home/superuser/.local/lib/python