tensorrt加速原理

tensorrt能够对模型进行加速,主要原因如下:
1、降低数据精度
模型训练通常使用 32 位或 16 位数据。而TensorRT支持kFLOAT(float32)、kHALF(float16)、kINT8(int8)三种精度的计算。可以通过低精度进行网络推理,达到加速的目的。但是该方法,会对推理精度有一定影响。

2、模型压缩
tensorrt对网络结构进行重构,把一些能合并的运算合并在一起,从而进行加速。合并方式主要为以下两种:
1)垂直合并
垂直方向,合并一些网络层。例如,把Conv、BN、Relu三个层融合为一个层CBR。
如图1到图2 的合并。
图1 原始网络Inception
图2 垂直合并

2)水平合并
将输入为相同张量和执行相同操作的层融合在一起。
例如,图2到图3。
图3 水平合并

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值