
部署
文章平均质量分 67
荪荪
这个作者很懒,什么都没留下…
展开
-
TensorRT教程
本教程不适用于CUDA新手TensorRT简单介绍现在TRT出了dynamic shape,重新应用与语音领域,成功一半。(目前在腾讯)闭源部分就是官方提供的库,是TRT的核心部分;开源部分在github上,包含Parser(caffe, onnx)、sample和一些plugin。一、 如何选择TensorRT版本建议使用TensorRT6.0或者TensorRT7.1:(1)GA版本;(2)支持的cuda版本广泛TensorRT6.0支持的cuda版本广泛,cuda9.0,cuda10原创 2021-05-14 09:54:12 · 3184 阅读 · 3 评论 -
TensorRT+CUDA加速优化版CenterNet旋转目标以及水平目标框的检测
前言由于工作项目所需,一直用centerNet做旋转目标检测,在实际产品或者工业应用上落地此检测算法,那么在足够的算力下, 更好优选的方式还是需要c/c++来部署实现。那么CenterNet也带来一个问题,那就是部署不太容易,主要是两个方面:主流实现大多不好支持onnx导出;后处理与传统的检测算法不太一样,比如nms,CenterNet用的实际上是一个3x3的maxpooling。此处还涉及到一点就是,原版的centerNet并可以检测旋转目标,所以此处就涉及到一个角度问题。首选是将cent原创 2021-05-11 09:23:58 · 1536 阅读 · 1 评论 -
对ONNX模型进行BN和卷积层的融合
import onnximport osfrom onnx import optimizer# Preprocessing: load the model contains two transposes.# model_path = os.path.join('resources', 'two_transposes.onnx')# original_model = onnx.load(model_path)original_model = onnx.load("resne18.onnx")#原创 2021-05-07 11:26:03 · 2262 阅读 · 0 评论