
cuda
文章平均质量分 58
AI算法网奇
资深算法工程师,优快云博客专家。多年一线算法研发经验 主要研究方向为三维重建、多模态模型。希望把我的经验和知识带给每一个喜欢钻研朋友,为中国人工智能行业添砖加瓦!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
nvidia 安装 失败解决 ddu安装
卸载显卡驱动后,重启电脑。原创 2025-05-26 10:19:09 · 263 阅读 · 0 评论 -
显存占用 显存测试
显存占用 显存测试原创 2024-11-03 23:47:48 · 888 阅读 · 0 评论 -
华为鲲鹏一体机 安装笔记
华为鲲鹏一体机 安装笔记原创 2024-11-03 19:28:09 · 1421 阅读 · 0 评论 -
显卡 pcie和SXM 的区别
显卡 pcie和SXM 的区别原创 2024-10-12 10:41:30 · 5641 阅读 · 0 评论 -
NVIDIA显卡报错:uncorrectable ECC error的问题
1、查看显卡状态 nvidia-smi, 发现了关键参数[Volatile Uncorr. ECC],4张显卡其中第3张的值与其他三张不同,这样就定位到了出故障的显卡。2、通过指令 nvidia-smi -i 2 -p 0 修复显卡状态。转载 2024-10-11 20:02:21 · 2296 阅读 · 0 评论 -
linux 僵尸进程 关闭看不见的进程
linux 僵尸进程 关闭看不见的进程原创 2023-12-05 20:24:56 · 966 阅读 · 0 评论 -
linux nvcc未找到命令
linux nvcc未找到命令转载 2023-03-17 19:01:53 · 2031 阅读 · 1 评论 -
Assertion failed: cublasStatus == CUBLAS_STATUS_SUCCESS
Assertion failed: cublasStatus == CUBLAS_STATUS_SUCCESS转载 2023-02-19 15:37:45 · 1552 阅读 · 0 评论 -
the lambda is an ‘extended lambda‘ and the flag --extended-lambda is specified
the lambda is an 'extended lambda' and the flag --extended-lambda is specified原创 2023-02-18 13:25:12 · 766 阅读 · 0 评论 -
tensorrt内存释放 笔记
tensorrt内存释放 笔记原创 2022-11-13 20:00:47 · 2254 阅读 · 1 评论 -
“CUDA_CHECK”: 找不到标识符 checkRuntime
“CUDA_CHECK”: 找不到标识符 checkRuntime原创 2022-11-13 19:33:27 · 2563 阅读 · 0 评论 -
Unknown CMake command “cuda_add_library“.
Unknown CMake command "cuda_add_library".原创 2022-11-10 00:54:30 · 3316 阅读 · 2 评论 -
name followed by “::“ must be a class or namespace name
name followed by "::" must be a class or namespace name原创 2022-11-10 00:08:22 · 3649 阅读 · 0 评论 -
dllexport/dllimport requires external linkage
dllexport/dllimport requires external linkage转载 2022-10-17 01:34:43 · 1271 阅读 · 0 评论 -
TensorRT6
TensorRT6原创 2020-03-29 16:15:17 · 3289 阅读 · 0 评论 -
tensorrt expecting compute 7.5 got compute 6.1, please rebuild
expecting compute 7.5 got compute 6.1, please rebuild原创 2022-08-17 23:43:50 · 1597 阅读 · 0 评论 -
c++ TensorRT TRT::Tensor 用法学习笔记
c++ TensorRT TRT::Tensor 用法学习笔记原创 2022-08-09 00:36:58 · 1690 阅读 · 0 评论 -
LNK2001 无法解析的外部符号 cuGetErrorName解决
LNK2001 无法解析的外部符号 cuGetErrorName解决原创 2022-08-06 03:10:51 · 1306 阅读 · 0 评论 -
cudaMemcpy学习笔记
cudaMemcpy学习笔记原创 2022-07-31 00:34:22 · 1847 阅读 · 0 评论 -
Assertion failed: inputs.at(2).is_weights
Assertion failed: inputs.at(2).is_weights转载 2022-07-20 18:07:13 · 1984 阅读 · 0 评论 -
Cuda Error in NCHWToNCHHW2解决
Cuda Error in NCHWToNCHHW2解决原创 2022-07-19 11:37:47 · 1730 阅读 · 0 评论 -
cuda.h: No such file or directory
cuda.h: No such file or directory转载 2022-07-12 19:28:08 · 3372 阅读 · 0 评论 -
The CUDA compiler identification is unknown 解决
TheCUDAcompileridentificationisunknown 解决原创 2022-07-12 11:33:26 · 4917 阅读 · 0 评论 -
gstreamer中如何使用probe(探针)获取帧数据
gstreamer中如何使用probe(探针)获取帧数据转载 2022-07-08 17:45:17 · 3345 阅读 · 0 评论 -
deepstream 预处理结果保存(进入模型前的图片)
deepstream 预处理结果保存(进入模型前的图片)转载 2022-07-08 14:12:38 · 2392 阅读 · 2 评论 -
cuda 排序算法笔记
Thrust是cuda自带的c++库,cuda安装好之后,这个库也默认安装好了。这个库基本是采用类似STL的接口方式,因此对于开发者非常友好,开发者不再需要关注内存与显存相关的问题了。排序入门例子#include <thrust/host_vector.h>#include <thrust/device_vector.h>#include <thrust/generate.h>#include <thrust/sort.h>#incl..原创 2022-03-30 00:52:41 · 2882 阅读 · 1 评论 -
thrust 学习笔记
gather与scatter正好相反:scatter是顺序输入根据map确定撒点输出位置。gather是根据map确定输入元素的位置,输出是按顺序的。如图:具体可以查看 https://blog.youkuaiyun.com/seamanj/article/details/82976687————————————————版权声明:本文为优快云博主「Scott f」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。原文链接:https://blog.cs..转载 2022-03-28 01:02:09 · 1655 阅读 · 0 评论 -
TensorRT C++ 批量推理笔记
文中的输出可以支持一个batch_size,不支持多个batch_size,批量预测还在调研void* buffers[2];buffers[inputIndex] = inputbuffer;buffers[outputIndex] = outputBuffer;1. TensorRT 的 C++API使用示例进行推理,需要先创建IExecutionContext对象,要创建这个对象,就需要先创建一个ICudaEngine的对象(engine)。两种创建engine的方...原创 2022-03-26 11:34:10 · 2436 阅读 · 2 评论 -
vs 更换cuda版本笔记
换了一台电脑,vs编译项目时,需要更换cuda版本,vs直接打开项目会报错,更换cuda方法:在project_xxx.vcxproj中更换cuda版本比如查找10.2 替换为11.0 <ImportGroup Label="ExtensionTargets"> <Import Project="$(VCTargetsPath)\BuildCustomizations\CUDA 10.2.targets" /> </ImportGro..原创 2022-03-10 23:00:51 · 2371 阅读 · 0 评论 -
NeuroDetection.cpp 2022.0203
单张图片调用:int main(){ char errMsg[256]; memset(errMsg, 0, 256); //1. 创建模型 //从云平台下载权重文件,只需使用该接口转化一次即可 /*BuildModel("./wts2/16676.wts", "./model/16676.model", 1, errMsg); std::cout << "BuildModel:" << errMsg <<..原创 2022-02-23 00:28:52 · 81 阅读 · 0 评论 -
“nvinfer1::ILogger”: 不能实例化抽象类
修改cuda版本:高级系统设置里面的path变量,可以修改cuda版本:v10.3版本不存在,就自动找v11.0了,nvcc -V打印出来是v11.0版本。“nvinfer1::ILogger”: 不能实例化抽象类tensorrt 7.2.3.7TensorRT-7.2.3.4.Windows10.x86_64.cuda-11.0.cudnn8.1当前cuda版本为10.1...原创 2022-01-18 00:45:21 · 2740 阅读 · 1 评论 -
opencv cuda使用笔记
转cpu: cv::Mat dst; flt_image_out.download(dst); cv::Mat dst_gold; cv::cvtColor(src, dst_gold, cv::COLOR_BGR2RGB);//打印一个Mat矩阵void PrintMat(Mat A){ for(int i=0;i<A.rows;i++) { for(int j=0;j<A.cols;j++) ...原创 2021-12-17 00:46:20 · 3540 阅读 · 0 评论 -
cv::cuda::split 使用
cv::cuda::spliterror:‘split’ is not a member of ‘cv::cuda’…error:‘resize’ is not a member of ‘cv::cuda’……recipe for target ‘all’ faildIncvking “make -j6 -l6” faild…这里可以通过添加对应的cv头文件解决error,比如#include <opencv2/cudaimgproc.hpp>#includ...原创 2021-12-16 23:46:18 · 4604 阅读 · 0 评论 -
nvcc 编译已退出,返回代码为1
nvcc 编译已退出,返回代码为1原因:cuda库目录版本写错了把库目录改对就行了。原创 2021-12-15 00:52:32 · 3286 阅读 · 0 评论 -
TensorRT was linked against cuBLAS/cuBLAS LT 11.2.0 but loaded cuBLAS/cuBLAS
TensorRT was linked against cuBLAS/cuBLAS LT 11.2.0 but loaded cuBLAS/cuBLASLT 10.2原因:TensorRT和cuda版本需要匹配重新下载和cuda版本匹配的版本TensorRT下载页面有选择版本的。原创 2021-12-14 20:46:02 · 5649 阅读 · 3 评论 -
c++ cuda拷贝内存
https://developer.nvidia.com/zh-cn/blog/how-overlap-data-transfers-cuda-cc/分批拷贝:for (int i = 0; i < nStreams; ++i) { int offset = i * streamSize; cudaMemcpyAsync(&d_a[offset], &a[offset], streamBytes, cudaMemcpyHostT..转载 2021-12-11 20:57:45 · 2067 阅读 · 0 评论 -
win10 tensorrt安装 踩坑记录
win10 tensorrt安装下载地址:https://developer.nvidia.com/nvidia-tensorrt-7x-download需要注册,登录。选择跟cuda对应的版本:1. 添加环境变量,比如:PATH:D:\it\TensorRT-7.1.3.4\lib 2. 安装uff和graphsurgeon,下载demo 需要的datacd D:\Software\TensorRT-7.1.3.4\graphsurgeonpip inst...原创 2021-12-10 18:43:56 · 9628 阅读 · 8 评论 -
Window编译Opencv CUDA版
https://blog.youkuaiyun.com/qq_30623591/article/details/82084113opencv+CUDA9.1+vs2015环境搭建,编译opencv库,调用GPU加速运算_公子_羽的博客-优快云博客_opencv 编译cudawindows上编译自己的opencv(含cuda) - 知乎使用OpenCV操作CUDA 图像_jacke121的专栏-优快云博客...原创 2021-12-10 12:20:03 · 3517 阅读 · 0 评论 -
tensorrt yolov5 批量预测学习笔记
多张图片预测:https://github.com/noahmr/yolov5-tensorrthttps://github.com/enazoe/yolo-tensorrt/blob/c4d72605f83d547081cc30c3b71458001826191d/modules/class_yolo_detector.hppcv::Mat trtInput = blobFromDsImages(vec_ds_images, _p_net->getInputH(),_p_net-&g..原创 2021-12-10 11:24:07 · 4259 阅读 · 0 评论 -
使用OpenCV操作CUDA 图像
void makeJPEG(PyObject* _py_list_src, int idx, int _target_size, bool _crop_to_square, PyObject* _py_list_tgt, bool withGpu) { cv::Mat _resized_mat_buffer; cv::cuda::GpuMat _resized_mat_buffer_gpu; std::vector<uchar> _output_jpeg_buf...转载 2021-12-10 10:37:15 · 2255 阅读 · 0 评论