将cuda的一些常用操作封装成接口API,供应用程序调用,一般主要用于模型部署应用的预处理。
支持的功能:
1. 内存管理 - cuAllocMapped 在Jetson系列的集成盒子上,CPU和GPU共用同一个内存地址,加速数据传输。 在PC端的显卡,CPU和GPU的内存地址可能不一致,需要分开使用CPU和GPU的指针。
2. 硬件支持的缩放与颜色空间转换操作 - cuResizeRGBLike 实现将ARGB/RGBA转换成BGR,并且同时实现缩放操作。
3. 颜色空间转换与数据类型转换操作 - cuConvert 在实现颜色空间转换的同时,将会图像由UCHAR类型转为Float类型,并且可以同时进行减均值操作。
4. 缩放、颜色空间转换、数据类型转换、减均值同时完成操作 - cuResizeConvert
5. 大数组填充操作 - cuArrayFillValue 对于大数组,使用CUDA快速完成填充操作,如初始化。
6. CUDA Stream同步操作 - cuStreamSynchronize

本文介绍了CUDA的几个常用接口API,用于模型部署的预处理工作。包括内存管理、硬件支持的缩放与颜色空间转换、颜色空间与数据类型转换、缩放转换与均值减去、大数组填充以及CUDA Stream同步操作。这些功能API在Jetson系列设备和PC显卡上都能提高数据处理效率。
705

被折叠的 条评论
为什么被折叠?



