CUDA相关技术与库功能解析
1. 模板参数优化性能提升
在某些操作中,对参数进行优化并针对8×8模板进行专门处理,能显著提升性能。以下是不同设备的性能提升情况:
| 设备 | CORRSHARED4 (GTPIX/S) | CORRSHARED4 (SPECIALIZED) (GTPIX/S) | 提升百分比 |
| ---- | ---- | ---- | ---- |
| GT200 | 19.63 | 24.37 | 24% |
| GF100 | 46.49 | 65.08 | 40% |
| GK104 | 93.88 | 97.95 | 4% |
从表格数据可以看出,不同设备的性能提升幅度有所不同,GF100的提升幅度相对较大,而GK104的提升幅度较小。这可能与设备的硬件特性、原有性能基础等因素有关。
2. 相关阅读资料
有不少资料对数字图像处理和相关算法进行了深入讨论。例如,有资料讨论了归一化相关性(pp. 583–586)以及用于计算示例程序中输出像素的对数变换(pp. 168–169)。还有J.P. Lewis的文章,其中包含了一种更渐近有效的方法来加速相关操作,该操作旨在将模板与输入图像中的每个像素进行匹配。Lewis使用FFT计算分子,使用求和面积表计算系数的分母。
3. CUDA手册库(chLib)介绍
CUDA手册库(chLib)是一组位于源代码项目chLib/子目录下的可移植头文件。它并非用于生产软件的重用,而是以最少的源代码提供必要的功能,以说明相关概念。chLib可移植到所有支持CUDA的目标操作系统,因此通常需要支持这些操作系统特性的交集。
超级会员免费看
订阅专栏 解锁全文
3878

被折叠的 条评论
为什么被折叠?



