
Cuda
Cuda学习是实践总结
用户名溢出
这个作者很懒,什么都没留下…
展开
-
cuda复数稀疏矩阵计算
【代码】cuda复数稀疏矩阵计算。原创 2024-06-27 16:03:17 · 196 阅读 · 0 评论 -
tex2D使用学习
项目中使用到了纹理进行插值的加速,因此记录一些自己在学习tex2D的一些过程。原创 2023-11-30 21:20:20 · 790 阅读 · 0 评论 -
Cuda cmake支持C++17
项目中cuda的编译需要使用到C++17的特性,但是自己在设置C++17的时候,一直不生效,最后找到一种生效的方式。1. 设置CMAKE_CUDA_STANDARD。2. 设置nvcc编译选项。原创 2023-11-07 17:05:38 · 1658 阅读 · 0 评论 -
nsight computer运行失败问题
项目中有部分CUDA代码耗时严重,所以想用工具进行统计,直接用visual profile能出来大致的结果,但是感觉还不够详细,因此想要使用nsight compute进行统计。原因是最新版本的Nsight compute抛弃了部分显卡的支持,因此需要回退到2019.5.1的版本才能运行。使用最新版本的nsight compute进行统计,老是报错:显示不支持当前显卡。原创 2023-09-08 21:22:54 · 915 阅读 · 0 评论 -
cuda显存访问耗时
项目中有个数据量大小为5195 * 512 * 128float = 1.268G的显存,发现有个函数调用很耗时,函数里面就是对这个显存进行128个元素求和,得到一个5195 * 512的图像。原创 2023-09-07 19:47:55 · 363 阅读 · 0 评论 -
调用cuda版本的静态库 Cmake配置
--静态库的头文件。1. 配置好依赖的静态库头文件和库。2. 配置好cuda本身依赖的库。原创 2023-07-08 09:51:56 · 679 阅读 · 0 评论 -
带错误检测的CUDA资源管理
为什么使用宏定义,而不是函数定义,是因为函数定义的话,如果希望在出错误的时候直接输出出错位置的文件和行号,就需要在使用接口的时候,将__FILE__和__LINE__传入进去,有点麻烦,因此使用了宏定义的方式。项目中发现很多cuda代码很冗余,主要是有一些cuda内存相关的操作,比如cudaMemcpy之后,要进行错误检测,所以修改了一版,实现接口内部自己检测,这样代码看起来不会那么乱。原创 2023-04-23 19:30:46 · 169 阅读 · 0 评论 -
AddressSanitize + CUDA Error
正确检测到了内存越界的位置,但是前面显卡数量输入错误。原创 2022-09-22 14:48:01 · 510 阅读 · 0 评论 -
Win下使用nvvp
很多同学在win下使用nvvp时,会遇到各种问题,先整理如下。出现这个错误,大概率你安装的不是jdk8。进去后,继续往下拉,就能找到java8了。进入链接之后,往下拉,找到下面位置。原创 2022-09-12 17:09:51 · 516 阅读 · 0 评论 -
cuda安装失败问题2:install of driver component failed
install of driver component failed原创 2022-08-27 16:48:04 · 4767 阅读 · 2 评论 -
C++多线程调用cuda Ver2
前面已经写过一个c++多线程调用cuda优化的文章,但是根据那种方式,在项目上尝试,发现仍然不行,其中一个库是加密库,看不到里面实现了什么,暂时叫它BF库,怀疑是BF库里面有大量的cudaMemcpy,所以才会导致效果不明显,所以这个文章再整理下库中包含cudaMemcpy的情况,也是边尝试,边整理。...原创 2022-08-17 00:04:53 · 1062 阅读 · 0 评论 -
cuda安装失败: cuda : Depends: cuda-11-7 (>= 11.7.1) but it is not going to be installed
cuda : Depends: cuda-11-7 (>= 11.7.1) but it is not going to be installed原创 2022-08-27 15:46:01 · 3725 阅读 · 0 评论 -
Cuda手撕二维数组
背景:项目开发过程中,有小伙伴(姑且称为小甲)写cuda程序一直运行出错,且百思不得其解,反复查看逻辑,感觉没有问题,一起review代码发现,其cuda逻辑中使用了二维指针,且使用错误,cuda二维指针的使用,初学者如果不使用cuda本身二维数组的申请,直接使用cudaMalloc,及其容易出错,因此写该篇文章,以供参考。...原创 2022-08-18 23:34:23 · 635 阅读 · 0 评论 -
the provided ptx was compiled with an unsupported toolchain
本人遇到这个问题的原因是,一个动态库在一个cuda驱动比较新的服务器上编译的,然后使用这个动态库,在cuda较老的驱动上运行。编译机器cuda版本信息。运行机器cuda版本信息。原创 2022-08-23 19:44:00 · 6402 阅读 · 1 评论 -
ubuntu cuda重装
查看有的说需要降级,但是感觉不对,因为正常编译环境中,gcc版本也是9.x的。3. 重新安装Cuda,最后OK。2. 卸载cuda工具包。原创 2022-09-03 11:46:11 · 1759 阅读 · 0 评论 -
主机端多线程调用CUDA性能问题
C++主机端多线程调用cuda原创 2022-08-14 18:39:41 · 1972 阅读 · 4 评论