数据格式_TensorRT 数据格式说明

博客介绍了NVIDIA TensorRT支持的不同数据格式,需考虑数据类型和布局两方面。数据类型有FP32、FP16、INT32和INT8;布局格式决定存储值顺序,还定义了NC/2HW2和NHWC8等格式,用于打包通道值并降低精度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

TensorRT 数据格式说明

NVIDIA ® TensorRT™支持不同的数据格式。需要考虑两个方面:数据类型和布局。

数据类型格式

数据类型是每个单独值的表示。它的大小决定了数值的范围和表示的精度;分别是FP32(32位浮点或单精度),FP16(16位浮点或半精度),INT32(32位整数表示)和INT8(8位表示)。

布局格式

布局格式决定了存储值的顺序。通常,批次维度是最左侧的维度,其它维度指的是每个数据项的各个方面,例如C 是频道 H 是高度,并且 w ^是宽度(以图片为单位)。总是忽略在这些之前的批量大小,C, H和 w ^ 通常依据以下示意图中。

c6cf96bd34a9bb53443e40026d23ad7b.png

1876363558cc5151ec6ef6c72f41d0b3.png

定义了更多格式,以将通道值打包在一起并降低精度。因此,TensorRT也支持格式 NC/2HW2 和 NHWC8。

在 NC/2HW2,每对通道值打包在一起 高宽矩阵(在奇数通道的情况下为空值)。结果是一种格式,其中的值 ⌈C/2⌉高宽矩阵是两个连续通道的值对。

This ordering interleaves dimensions as values of channels that have stride 1 if they are in the same pair and stride 2xHxW otherwise.

1c268b93cfce2b103945f0d8460d176d.png

在 NHWC8, HxW矩阵包含所有通道的值。此外,这些值打包在一起⌈C/8⌉ 8元组里, C 四舍五入到最接近的8的倍数。

dab3c3bbd98606e64b4c676abf1a30ff.png
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值