
遇见CUDA
CUDA并行计算
李迎松~
MVS/Stereo/3D 算法
展开
-
【遇见CUDA】要更快,请提高数据传输效率!
你的CUDA算法,数据传输是否是你的性能瓶颈呢?要用常规还是异步?锁页还是零拷贝?看完此文,你应该能有所判断!原创 2020-08-17 21:22:26 · 12468 阅读 · 9 评论 -
放一个GPU版的SGM,看能不能跑赢KITTI采集车
视频演示 HierSgmCuda Run KITTI2015 算法架构论文参考李迎松. 摄影测量影像快速立体匹配关键技术研究[D]. 2018....原创 2020-05-02 21:01:14 · 3317 阅读 · 7 评论 -
【遇见CUDA】线程模型与内存模型
文章目录@[toc]前言CUDA线程模型(如何组织线程)CUDA内存模型(了解不同内存优缺点,合理使用)前言 CUDA(Compute Unified Device Architecture)[139]是显卡厂商NVIDIA推出的通用并行计算平台和编程模型,它利用NVIDIA GPU中的并行计算引擎能更有效地解决复杂的计算问题。通过使用CUDA,开发人员可以像在CPU上那样直接访问GPU设...原创 2018-11-21 09:44:45 · 4342 阅读 · 0 评论 -
【遇见CUDA】CUDA算法效率提升关键点概述
文章目录前言存取效率计算效率性能优化要点展现足够的并行性优化内存访问优化指令执行前言 CUDA算法的效率总的来说,由存取效率和计算效率两类决定,一个好的CUDA算法必定会让两类效率都达到最优化,而其中任一类效率成为瓶颈,都会让算法的性能大打折扣。存取效率 存取效率即GPU和显存之间的数据交换效率,在上一篇博客中,我们介绍了GPU的存储结构,对GPU的各类存储介质有了一个初步的了解,...原创 2018-11-22 19:07:31 · 6048 阅读 · 3 评论