
CUDA/TensorRT
柳鲲鹏
建立了编程学(编程基本功、平台化编程)、六石管理学等几个流派。
每涉及一个领域,都是顶级砖家。在这些领域中,如果遇到问题,最后肯定是搜索到本博客。
展开
-
NVIDIA下载老版本驱动/CUDA/Video Codec SDK的链接
有时不好找,所以专门发出来:https://developer.nvidia.com/cuda-toolkit-archive原创 2020-11-01 16:08:55 · 1690 阅读 · 0 评论 -
CentOS安装NVidia驱动提示kernel source path问题
之前是安装好了,也记录下来了。结果这次就死活安装不上。怎么办?参考:https://quantum6.blog.youkuaiyun.com/article/details/106931358 有两点说明:安装依赖库。 查看一下/usr/src/kernels,有一个目录,这个完整路径就是所谓的kernel source。类似:--kernel-source-path=/usr/src/kernels/3.10.0-1127.19.1.el7.x86_64...原创 2020-10-31 06:31:51 · 7352 阅读 · 0 评论 -
一定不要安装CUDA附带的显卡驱动
有人向吾报怨显卡硬解有问题。吾听着就奇怪了,吾这边好好的,他那边显卡还比吾高档,怎么反而不能用呢?吾仔细一看其输出: 注意图中8bit,竟然都是0。正确的图应该是: 一看其显卡版本比吾高,吾就问,是不是使用了CUDA附带的驱动?对方回答是。让其安装标准驱动,果然正确。...原创 2020-07-08 20:15:52 · 3237 阅读 · 0 评论 -
全网首发:FFMpeg使用NVIDIA DECODER,解码后的数据转换为YUV420P
我们日常所用格式虽然是RGB,视频喜欢提YUV。如上文所述,解码后的数据是RGB,如何转换为YUV?自己写代码进行转换。这个方法显然是不可取的。 调用已有函数。 这个已有的函数在哪里?这可没有人说啊。怎么办?想起之前使用过ffplay,看看这个代码如何处理的。先找到解码函数,即得到的AVFrame。输出一看,确实是RGB。 找到刷屏的地方,使用的确实是YUV。 跟踪整个中间过程,确实看到某个地方,转变为YUV。具体处理代码是://1280,1280,0 ret = av原创 2020-07-05 07:44:53 · 2930 阅读 · 17 评论 -
FFMPEG编译ffplay
安装SDLyum install -y SDL-devel编译参数# export is must useexport PKG_CONFIG_PATH=/usr/local/lib/pkgconfig:${PKG_CONFIG_PATH}pkg-config --modversion ffnvcodecCUDA_PATH=nvcc=/usr/local/cuda-11.0make cleanexport ECFLAG="-fPIC"./configure \ -原创 2020-07-01 06:59:13 · 792 阅读 · 0 评论 -
ffmpeg把YUV转换为H264
ffmpeg -pix_fmts原创 2020-06-28 21:59:35 · 3268 阅读 · 0 评论 -
FFMpeg编译支持NVidia CODEC(成功)
下载头文件git clone https://git.videolan.org/git/ffmpeg/nv-codec-headers.gitcd nv-codec-headerssudo makesudo make install下载ffmpeg最新的。重新编译export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig:${PKG_CONFIG_PATH} pkg-config --modversion ffnvcodec X264.原创 2020-06-26 13:31:03 · 7654 阅读 · 33 评论 -
ERROR: cuvid requested, but not all dependencies are satisfied: ffnvcodec
PKG_CONFIG_PATH shoud has ffnvcodec.pc原创 2020-06-26 13:22:21 · 1778 阅读 · 0 评论 -
编译NVIDIA之Video_Codec_SDK_9.1.23之Sample
download and installhttps://blog.youkuaiyun.com/quantum7/article/details/106932663libhttps://blog.youkuaiyun.com/quantum7/article/details/106954214https://blog.youkuaiyun.com/quantum7/article/details/106954225modifyhttps://blog.youkuaiyun.com/quantum7/article/details/原创 2020-06-25 06:58:08 · 2264 阅读 · 0 评论 -
编译错误:GL/glew.h, GL/glut.h, EGL/egl.h没有那个文件或目录
In file included from AppDecGL.cpp:26:0:FramePresenterGL.h:21:21: 致命错误:GL/glew.h:没有那个文件或目录#include <GL/glew.h>sudo yum install glew-develIn file included from AppDecGL.cpp:26:0:FramePresenterGL.h:22:21: 致命错误:GL/glut.h:没有那个文件或目录#include <..原创 2020-06-25 06:52:46 · 7099 阅读 · 3 评论 -
AV_PIX_FMT_YUV420P12LE’在此作用域中尚未声明
In file included from AppDec.cpp:26:0:../../NvCodec/../Utils/FFmpegDemuxer.h: 在构造函数‘FFmpegDemuxer::FFmpegDemuxer(AVFormatContext*)’中:../../NvCodec/../Utils/FFmpegDemuxer.h:93:14: 错误:‘AV_PIX_FMT_YUV420P12LE’在此作用域中尚未声明 case AV_PIX_FMT_YUV420P12LE.原创 2020-06-25 06:33:40 · 1302 阅读 · 0 评论 -
NVIDIA官方指南:libav编译支持Nvidia Codec(结果失败)
https://developer.nvidia.com/ffmpeggit clone https://git.videolan.org/git/ffmpeg/nv-codec-headers.gitcd nv-codec-headers && sudo make installmake clean./configure \ --prefix=/usr/local \ --enable-shared \ --enable-libx264 \原创 2020-06-23 22:33:07 · 715 阅读 · 0 评论 -
CentOS安装NVIDIA Video Codec SDK
https://developer.nvidia.com/nvidia-video-codec-sdk/download原创 2020-06-23 22:19:07 · 2745 阅读 · 0 评论 -
CentOS安装Nvidia显卡驱动和CUDA
checklsmod | grep nouveau修改/etc/modprobe.d/blacklist.conf 文件,加入一行并保存 #nvidia driver blacklist nouveau# 备份原来的镜像文件mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak# 重建新镜像文件dracut /boot/initramfs-$(uname -r).im...原创 2020-06-23 21:05:04 · 5707 阅读 · 0 评论 -
LINUX下载安装CUDA
网页https://developer.nvidia.com/cuda-downloads?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1804&target_type=runfilelocal下载http://developer.download.nvidia.com/compute/cuda/11.0.1/local_installers/cuda_11.0.1_4原创 2020-06-14 19:48:37 · 3571 阅读 · 0 评论 -
编译onnx-tensorrt产生libnvonnxparser.so
TensorRT 4.0没有这个,只能自己产生。5.0就有了。git clone --recursive https://github.com/onnx/onnx-tensorrt.gitrm -rf buildmkdir buildcd buildcmake .. -DTENSORRT_ROOT=/home/quantum6/TensorRT-4.0.1.6make -j8s...原创 2019-03-24 20:31:13 · 2083 阅读 · 0 评论 -
编译OpenCV:precomp.hpp:60:37: fatal error: dynlink_nvcuvid.h
原因:CUDA有一些接口过期了。解决办法:cmake增加选项:-D CUDA_NVCC_FLAGS="-D_FORCE_INLINES" -D BUILD_opencv_cudacodec=ONcmake -D CMAKE_BUILD_TYPE=RELEASE \-D CMAKE_INSTALL_PREFIX=/usr/local -D WITH_CUDA=on \-D ENAB...原创 2019-03-24 13:53:46 · 4560 阅读 · 9 评论 -
解决方法:Linux装完显卡驱动后分辨率显示不正常
昨天装完Dell T630,登录界面分辨率太低。以为驱动安装的有问题,重装了几次,又核查了命令,都正确。于是就网上找了个办法:# 19201080是你想要的分辨率 60是刷新率cvt 1920 1080 60# 输出一般是1920x1080 59.96 Hz (CVT 2.07M9) hsync: 67.16kHz; pclk: 173.00 MHz Modeline “19...原创 2019-03-24 08:06:49 · 3825 阅读 · 0 评论 -
解压 .solitairetheme8 文件
今天下载cudnn,突然发现后缀变了。心里这个奇怪啊,没事变什么后缀?LINUX一直是有能用的,这不是故意给别人增加难度嘛。 怎么办?倒也简单:mv cudnn-10.0-linux-x64-v7.5.0.56.solitairetheme8 cudnn-7.tgztar -xvf cudnn-7.tgz 然后按照正常的办法安装。...原创 2019-03-23 20:38:34 · 2255 阅读 · 7 评论 -
matplotlib 2.2.4 has requirement python-dateutil>=2.1, but you'll have python-dateutil 1.5
sudo pip install --upgrade python-dateutil转载 2019-03-26 09:15:34 · 5109 阅读 · 0 评论 -
ImportError: No module named tensorrt
对于安装TensorRT的朋友,可能觉得莫名其妙。如下安装:sudo pip2 install ../TensorRT-4.0.1.6/python/tensorrt-4.0.1.6-cp27-cp27mu-linux_x86_64.whl原创 2019-03-26 09:05:30 · 12331 阅读 · 9 评论 -
解决办法:nvidia-settings:ERROR: Unable to load info from any available system
遇到这个错误,也让人很无奈,还好,吾终于找到了解决办法:sudo apt-get install nvidia-settings 之后又出现下面的错误,不知何意:** (nvidia-settings:3684): WARNING **: PRIME: 执行子进程“/usr/bin/prime-supported”失败(没有那个文件或目录)** Message: PRIM...原创 2019-03-25 14:03:50 · 24554 阅读 · 10 评论 -
onnx-tensorrt:builtin_op_importers.cpp:628:5: error: ‘IIdentityLayer’ is not a member of ‘nvinfer1’
如果在TensorRT 4.0上编译,就有这个错误;5.0就没有(集成了)。 怎么办?注释掉这个代码,重新编译即可。原创 2019-03-24 20:46:38 · 1681 阅读 · 2 评论 -
UBUNTU正确安装NVIDIA驱动的方法
经过高人指点,正确办法如下:# remove old driverssudo apt-get purge NVIDIA*sudo apt-get remove nvidia-*# disable nouveau driverDEST_FILE=/etc/modprobe.d/blacklist.confsudo echo ...原创 2019-03-31 19:30:11 · 2128 阅读 · 0 评论 -
ImportError: libcudart.so.10.0: cannot open shared object file
解决办法:sudo ldconfig /usr/local/cuda-10.0/lib64原创 2019-03-27 19:49:44 · 12318 阅读 · 0 评论 -
错误:customWinogradConvActLayer.cpp
customWinogradConvActLayer.cpp:159: std::unique_ptr<dit::Convolution> nvinfer1::cudnn::WinogradConvActLayer::createConvolution(const nvinfer1::cudnn::CommonContext&, bool, const int8_t*) co...原创 2019-04-06 11:59:00 · 996 阅读 · 0 评论 -
CUDA的内存泄露问题及解决办法
这几天,发现程序运行时,内存不断增加。首先吾确认自己的代码没有内存泄露,因为自己反复排查过多次,并测试过多次。于是跟踪刚加入的一个插件。于是对其内存进行了排查,发现也没有问题。嗯? 这意思就是,插件运行,导致吾这里内存有泄露?于是对各个功能进行了屏蔽,发现CUDA转JPG的代码会导致内存增加。注释之后,内存不增加了。于是不断的尝试,其中有几次错误结论,终于定位到了错误语句:NPP_C...原创 2018-09-26 20:12:44 · 6312 阅读 · 2 评论 -
NVIDIA H264解码是硬件电路还是CUDA
因为近来发现,接入多路视频流时,CUDA性能大幅下降。同事表示,这个跟解码相关。于是在网上搜索了一番,发现一个有意思的观点:NVIDIA H264是软解。 一般而言,我们说的软解,是指使用CPU进行整个解码流程。如果是使用硬件(芯片电路)进行解码,那么就是硬解。而NVIDIA解码,有人表示是使用CUDA进行处理,也就是没有专用的硬件电路。 如果是这样,那么NVIDIA进行H264解...原创 2019-04-19 13:37:23 · 4108 阅读 · 8 评论 -
NVIDIA显卡超过一定路数,性能急剧下跌
昨天发现,推理性能很差。同事远程连接过来检查。首先肯定是认为吾计时有问题,自己加了点计时。结果还真是差。 反复检查代码,并无问题。于是怀疑到主机内存与显存的交换,也没问题。 于是吾想到,支持的路数,导致性能下跌。于是减为4路,情况良好;6路马上就差了。这是为什么呢?解码器占用了?吾将解码器转移到另外的显卡,问题依旧。 原来估算一个显卡够用,明显是……...原创 2019-04-13 12:19:24 · 877 阅读 · 0 评论 -
OpenCV尽量不要打开CUDA参数编译,否则太慢了
每次编译OpenCV,都有点发愁。为什么呢?耗时非常之多。 有同事建议,WITH_CUDA=OFF,可以大大加快编译速度。吾试之,果然。速度快了多少?感觉怎么也有个10倍的差异。 那么这个参数会带来多少好处呢?没有测试过。...原创 2019-04-20 17:02:46 · 3441 阅读 · 4 评论 -
TensorRT:AttributeError: 'module' object has no attribute 'Logger'
TensorRT版本与代码写法不对.具体写法: # using trt 4.0 G_LOGGER = trt.infer.ConsoleLogger(trt.infer.LogSeverity.INFO) trt_engine = trt.utils.load_engine(G_LOGGER, engine_path) ""...原创 2019-04-16 16:14:14 · 4154 阅读 · 2 评论 -
LINUX上,2080/1080卡不要混插
LINUX上,2080/1080卡不要混插。这样可能引起莫名其妙的问题,还没法解决。 如果非要混插,注意驱动用最新的,CUDA、CUDNN、TensorRT等等,都要用最新的,以支持2080。不过,这时1080可能没法正常运行。 遇到问题,首先想到的就是只用一个卡,试试有没有问题。没有,再加卡。这样可以避免忙活几天,结果发现是显卡冲突。...原创 2019-04-09 20:36:55 · 963 阅读 · 0 评论 -
DeepStream3必须安装Video_Codec_SDK9
否则必错。在编译其他软件时,如果遇到cuvid这一类的文件错误,也是版本问题。原创 2019-04-01 21:25:59 · 2274 阅读 · 2 评论 -
docker: Error response from daemon: Unknown runtime specified nvidia.
事情是这样的:安装NVIDIA的UBUNTU,突然驱动没有吧。重新安装驱动,莫名其妙的出现了这样的问题。解决办法:sudo mkdir -p /etc/systemd/system/docker.service.dsudo tee /etc/systemd/system/docker.service.d/override.conf <<EOF[Service]...原创 2019-03-28 08:23:09 · 1821 阅读 · 0 评论 -
编译OpenCV:nvcc fatal : Unsupported gpu architecture 'compute_75'
编译时提示如下错误:nvcc fatal : Unsupported gpu architecture 'compute_75' 应该是GPU太新,使用的CUDA9.2版本不支持。 吾去掉CUDA_GENERATION=Auto,编译通过。...原创 2019-03-24 19:12:41 · 6348 阅读 · 9 评论 -
解决办法:RuntimeError: module compiled against API version 0xc but this version of numpy is 0xa
运行遇到错误如下:RuntimeError: module compiled against API version 0xc but this version of numpy is 0xa 刚刚做了什么?python2.7下,numpy降级了.可是吾已经编译过了啊.这是怎么回事? 网上都说升级numpy.可是咱明明是降级啊.为什么要降级?肯定迫不得已.怎么办? 首先排...原创 2019-03-21 11:20:05 · 8721 阅读 · 0 评论 -
初步猜测,当map所在线程跟显存有关时,容易崩溃
以前调试时,发现map在find的时候崩溃.当时认定是线程问题. 现在改为独立线程,在某个的线程直接操作map,还是会崩溃. 于是看了一下这个线程,因为使用显卡功能,所以初步怀疑跟显存有关.目前没有进一步的分析....原创 2019-03-09 12:39:57 · 370 阅读 · 0 评论 -
错误解决:src/cpp/cuda.hpp: fatal error: cuda.h
这几天被这个搞得焦头烂额。后来总算是解决了。在.bashrc中,如下修改:export CUDA_ROOT=/usr/local/cuda-9.2export PATH=$CUDA_ROOT:$CUDA_ROOT/bin:/usr/local/bin:$PATH 奇怪的是,如果是export CUDA_ROOT=/usr/local/cuda,可能有怪问题。生效ba...原创 2018-10-31 08:46:07 · 6626 阅读 · 3 评论 -
Pytorch转TensorRT范例代码
TensorRT官方文档说,/usr/src/tensorrt/samples/python/network_api_pytorch_mnist下有示例代码。实际上根本就没有。这里提供一个示例代码,供参考。 这个范例的具体位置是:/usr/local/lib/python3.5/site-packages/tensorrt/examples/pytorch_to_trt#!/usr...原创 2018-10-25 15:56:56 · 12031 阅读 · 14 评论 -
编译安装汇总:nVidia驱动/CUDA/cuDNN/TensorRT/OpenCV/gstreamer/DeepStream/jpeglib等
柳鲲鹏重新安装了一遍,各种问题都遇到了,也都记录了。为了查阅方便,特别进行了一次汇总。注意:DeepStream 2.0,必须:驱动396,CUDA 9.2。如果不用DeepStream 2.0,使用驱动390,CUDA 9.0。 序号 安装项目 版本 等级 结果 ...原创 2018-09-30 08:54:32 · 1164 阅读 · 0 评论