数据格式_TensorRT 数据格式说明

最新推荐文章于 2024-10-31 11:40:31 发布

weixin_39804523

最新推荐文章于 2024-10-31 11:40:31 发布

阅读量321

点赞数

CC 4.0 BY-SA版权

文章标签：数据格式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_39804523/article/details/112623064

博客介绍了NVIDIA TensorRT支持的不同数据格式，需考虑数据类型和布局两方面。数据类型有FP32、FP16、INT32和INT8；布局格式决定存储值顺序，还定义了NC/2HW2和NHWC8等格式，用于打包通道值并降低精度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

TensorRT 数据格式说明

NVIDIA ® TensorRT™支持不同的数据格式。需要考虑两个方面：数据类型和布局。

数据类型格式

数据类型是每个单独值的表示。它的大小决定了数值的范围和表示的精度；分别是FP32（32位浮点或单精度），FP16（16位浮点或半精度），INT32（32位整数表示）和INT8（8位表示）。

布局格式

布局格式决定了存储值的顺序。通常，批次维度是最左侧的维度，其它维度指的是每个数据项的各个方面，例如C 是频道 H 是高度，并且 w ^是宽度（以图片为单位）。总是忽略在这些之前的批量大小，C， H和 w ^ 通常依据以下示意图中。

定义了更多格式，以将通道值打包在一起并降低精度。因此，TensorRT也支持格式 NC/2HW2 和 NHWC8。

在 NC/2HW2，每对通道值打包在一起高宽矩阵（在奇数通道的情况下为空值）。结果是一种格式，其中的值 ⌈C/2⌉高宽矩阵是两个连续通道的值对。

This ordering interleaves dimensions as values of channels that have stride 1 if they are in the same pair and stride 2xHxW otherwise.

在 NHWC8， HxW矩阵包含所有通道的值。此外，这些值打包在一起⌈C/8⌉ 8元组里， C 四舍五入到最接近的8的倍数。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。