
CUDA
张欣-男
人,最宝贵的是生命;它,给予我们只有一次。人的一生,应当这样度过:当他回首往事时,不因虚度年华而悔恨,也不因碌碌无为而羞耻;这样在他临死的时候,他就能够说:我已经把我的整个生命和全部精力,都献给了这个世界上最壮丽的事业——为了人类的解放而斗争
展开
-
paddleocr使用问题01_segment_fatal
1 问题--------------------------------------C++ Traceback (most recent call last):--------------------------------------0 paddle::framework::SignalHandle(char const*, int)1 paddle::platform::GetCurrentTraceBackString[abi:cxx11]()------------------原创 2021-11-11 20:36:41 · 1053 阅读 · 3 评论 -
【GPU高性能编程CUDA实战】第5章线程协作
5.2 并行线程块的分解add<<<N, 1>>>(dev_a, dev_b, dev_c);第一个参数:启动的线程块数量。第二个参数:每个线程块中创建的线程数量。5.2.1 矢量求和:重新回顾1. 使用线程实现GPU上的矢量求和代码:add_loop_blocks.cu// 启动N个线程块,每个线程块对应一个线程// add<<&...原创 2019-03-14 11:47:03 · 234 阅读 · 0 评论 -
【GPU高性能编程CUDA实战】第6章常量内存与事件
6.2 常量内存__constant__ //修饰符,常量内存变量cudaMemcpyToSymbol // 复制到常量内存当线程束中的所有线程都访问相同的只读数据时,将获得额外的性能提升。在这种数据访问模式中使用常量内存可以节约内存带宽,因为(1)读取操作在半线程束中广播,(2)在芯片上包含了常量内存缓存。6.3 使用事件来测量性能 // capture the...原创 2019-03-14 17:59:13 · 153 阅读 · 0 评论 -
【GPU高性能编程CUDA实战】第3章_CUDA_C简介
第三章 CUDA C简介代码地址:ZhangXinNan/CUDA-by-Example-source-code-for-the-book-s-examples-3.2 第一个程序3.2.1 hello world代码:hello_world.cu主机(host):CPU及系统的内存称为主机。设备(device):GPU及其内存称为设备。核函数(kernel):GPU上运...原创 2019-03-13 13:55:58 · 266 阅读 · 0 评论 -
【GPU高性能编程CUDA实战】第4章CUDA_C并行编程
4.2 CUDA并行编程4.2.1 矢量求和运算基于CPU的矢量求和代码:add_loop_cpu.cu基于GPU的矢量求和代码:add_loop_gpu.cuadd<<<N,1>>>(dev_a, dev_b, dev_c);尖括号中第一个数值:设备在执行核函数时使用的并行线程块的数量。blockIdx 是一个内置变量,CUDA运行时已经...原创 2019-03-13 17:02:13 · 326 阅读 · 0 评论