
GPU
King-Five
这个作者很懒,什么都没留下…
展开
-
cuda 和 C++ 文件混编Makefile 实现
.PHONY: all cleanCUDA_LIB_DIR := /usr/local/cuda/lib64LIBS += -lcudartLIBS += -lcudaCU_SRCS := $(wildcard *.cu)CU_OBJS := $(CU_SRCS:%.cu=%.o)C_SRCS := $(wildcard *.cpp)C_OBJS := $(C_SRCS:%.c...原创 2019-04-25 14:16:14 · 2650 阅读 · 0 评论 -
tensorRT 中的推理得分函数分析
分析TensorRT中的int8量化代码中的推理结果统计分析代码,输出推理结果中top1和 top5的统计情况int calculateScore(float* batchProb, float* labels, int batchSize, int outputSize, int threshold){ int success = 0; for (int i = 0; i &...原创 2019-04-30 16:18:16 · 2971 阅读 · 1 评论 -
Cuda atomic操作
注意:函数运算完之后,会将运算结果保存在第一个参数指针指定的空间位置,返回的是old值。int atomicAdd(int* address, int val);unsigned int atomicAdd(unsigned int* address,unsigned int val);unsigned long long int atomicAdd(unsigned long long ...原创 2019-05-07 10:31:41 · 1254 阅读 · 0 评论 -
TensorRT plugin实现总结
继承IPluginExt 并重写一系列虚函数,包括:getNbOutputs 该层返回输出的张量个数,getOutputDimensions返回输出的张量维度(返回多个张量咋写? 估计会根据index返回不同的Dims结构),configureWithFormat 根据数据个数做出一些调整,反正会传入一个DataType参数,看程序是否需要做一些调整。initialize 做一些初始...原创 2019-05-07 11:25:34 · 9739 阅读 · 1 评论