tensorrt使用文档（一）

最新推荐文章于 2025-11-14 18:04:27 发布

原创

最新推荐文章于 2025-11-14 18:04:27 发布 · 1.4k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

NVIDIA TensorRT是一个用于GPU高性能推理的C++库，它通过模型优化和运行时方法实现网络定义和性能提升。TensorRT支持多种网络层，如激活、卷积、连接等，并能利用Pascal和Volta GPU的特性。库还包含Python接口，支持从NVCaffe和其他框架导入模型，并提供了示例应用。TensorRT的API允许开发人员进行网络导入、校准、生成和部署。

Overview

NVIDIATensorRT™是一个C ++库，可以帮助NVIDIA图形处理器（GPU）进行高性能推理。 TensorRT通过合并张量和图层，转换权重，选择高效的中间数据格式，并根据图层参数和测量的性能从大型内核目录中进行选择，从而对网络进行定义并对其进行优化。

TensorRT包含导入方法，可帮助您为TensorRT表达训练有素的深度学习模型以优化和运行。它是一种优化工具，可以应用图形优化和图层融合，并利用各种高度优化的内核集合找到该模型的最快实现，以及可用于在推理上下文中执行此网络的运行时方法。

TensorRT包含一个基础架构，可让您利用Pascal和Volta GPU的高速降低精度功能作为可选优化。

TensorRT是基于GCC4.8的。

1. TensorRT Layers

TensorRT可以直接支持下面类型的网络层：

Activation （激活层）：

激活层是每个元素的激活方法，它目前支持一下几种类型的激活层：

ReLU ， tanh ， sigmod

Concatenation （连接层）：

连接层链接通过通道维度链接多个相同高度和宽度的张量

Convolution( 卷基层 )：

卷基层是一个三维的卷积操作，有时会加入bias（偏置量）

Deconvolution

反卷基层是一个反卷积操作，有时会加入bias（偏置量）

ElementWise

ElementWise层是一些常用的元素操作。目前支持的有： sum, product, maximum, subtraction, division 和 power.

Flatten

Flatten层的作用是使输入的张量在大小不变的情况下，变得扁平化。举个例子：一个输入张量形状为：n*c*w*h（4维）；输出为一个大小为n*(c*w*h)（一维）的向量

FullyConnected

FullyConnected实现的是一个矩阵向量的乘积，有时会加入bias（偏置量）

LRN

LRN层实现了一个跨通道的局部响应归一化

最低0.47元/天解锁文章

评论 1

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。