- 博客(11)
- 收藏
- 关注
原创 CUDA:目标检测后处理的GPU实现
我们在这篇博客中通过两个核函数decode_gpu和nms_gpu对目标检测算法的输出进行处理,decode_gpu初略的删除了置信度低的框,并将每个框的信息进行整理输出。nms_gpu对decode_nms的输出进行进一步的处理,删除了预测框中重叠度高的框。
2024-01-10 11:52:40
1091
2
原创 CUDA:GELU算子的实现(FP16)
本文是通过CUDA实现GELU算子,输入和输出的数据是FP16类型的,通过自定义向量结构体进行向量化访存的方式来提高算子工作效率,并会详细解释相关代码。
2023-12-28 13:12:15
2546
1
原创 C++面经
答:面向对象的特征包括封装,继承和多态。封装是将数据和操作数据的方法隐藏起来,具体形式比如类,结构体。封装的好处就是隐藏的数据的内部实现,提高了代码的可维护性和安全性。继承就是指一个类继承另一个类的特性和行为,被继承的类称为父类,继承的类称为子类。继承的好处在提高代码的复用性。多态就是说对象在运行时会表现出不同的行为状态,多态包括编译时多态和运行时多态,编译时多态是说这个对象的行为是在编译时确定的,比如函数重载,函数模板和类模板。运行时多态是指对象的行为是在运行时确定的,比如常说的父类的指针指向子类的对象。
2023-12-25 15:14:12
930
原创 CUDA:一个完整的CPU>>GPU程序
说在前面:本文主要给出一个简单的CUDA程序,用来说明一个完整的核函数是如何在CPU端进行调用的,并且会对相关代码做出详细解释。
2023-12-22 11:41:24
1279
原创 c/c++内存泄漏解决方案:hook函数
本文主要介绍关于内存泄漏的相关知识,包括什么是内存泄漏,以及如何使用hook函数去判断是否存在内存泄漏以及发现内存泄漏具体位置。
2023-12-21 11:42:28
2274
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人