CUDA编程
文章平均质量分 69
Simple_Bright&Man
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
CUDA编程练习(十四) Thrust、CuBLAS、CuRAND和CuDNN
还是充满未知。万万不可放弃、不可过于急躁原创 2024-06-06 11:44:02 · 885 阅读 · 0 评论 -
CUDA编程练习(十三) 样本排序
脑子清楚着才能干活,效率有数倍之差。我先躺会儿。。。。原创 2024-06-05 21:07:12 · 610 阅读 · 0 评论 -
CUDA编程练习(十二) 双调归并排序
本想把样本排序一并写了。还是算了,想躺床上了。。。原创 2024-06-04 20:51:11 · 658 阅读 · 0 评论 -
CUDA编程练习(十一) 矩阵转置
加一篇,本篇不是很多原创 2024-06-04 13:44:28 · 841 阅读 · 0 评论 -
CUDA编程练习(十) 前缀和
今天说要写两篇就写两篇,必须给它调试通了,奥里给原创 2024-06-03 23:16:14 · 739 阅读 · 0 评论 -
CUDA编程练习(九) 归约
拖延症晚期,但是还有得救原创 2024-06-03 10:18:50 · 660 阅读 · 0 评论 -
CUDA编程练习(八) Nsight System使用与服务器连接
这篇文章内容不多,今天再加一篇。。。原创 2024-06-02 23:00:49 · 2915 阅读 · 0 评论 -
CUDA编程练习(七) CUDA_GDB与VSCode的自带调试器
学软件操作是这样的,从头到尾透露着一种抽象,反直觉、低“人机工效”、暴击思维惯性还暴击我这个操作快于脑子的习惯原创 2024-06-01 17:52:04 · 2071 阅读 · 3 评论 -
CUDA编程练习(六) 卷积
一天一杯咖啡就够了,前两天明显过载。本文实现了几种矩阵乘法,单通道的输入输出,加了步长因素原创 2024-05-31 16:50:11 · 2018 阅读 · 0 评论 -
CUDA编程练习(五) 排序
XX排序+归并还是好,避开了多block的同步问题也是,GPU设计出来多block同步个什么劲儿,多轮就多轮共存+循环版本可以搞一搞,提高排序的上限边界条件可以换成把数组变成对齐数组,这样也能提高效率明天搞卷积,样本排序什么的往后稍稍,排得头晕。原创 2024-05-30 21:55:40 · 887 阅读 · 0 评论 -
CUDA编程练习(四) 矩阵相乘
今日强度:高。今日情绪:高压。日满意度:一般。矩阵乘法的内容应该不止这么多,这些只是凭借记忆和理解,后续还需要补充。后面还有排序是个大坑没开原创 2024-05-29 17:59:46 · 2206 阅读 · 1 评论 -
CUDA编程练习(三) 向量内积
装VSCode和配置VSCode的过程请多使用GPT4o,我也不能确定一个固定的步骤,因为我知道,以后一定会该里面乱七八糟的json文件,现在能用就够了。。。原创 2024-05-28 22:28:55 · 521 阅读 · 0 评论 -
CUDA编程练习(二) 向量相加
同一天做的东西,是个开始,希望能坚持下去原创 2024-05-28 22:11:33 · 376 阅读 · 0 评论 -
CUDA编程练习(一) 环境创建
以后会按照个人学习进度进行更新。原创 2024-05-28 22:06:39 · 477 阅读 · 0 评论
分享