原理及操作
量化的基本原理及流程可参看懂你的神经网络量化教程:第一讲、量化番外篇、TensorRT中的INT8、tensorRT int8量化示例代码
Tensorrt
方式1:trtexec(PTQ的一种)
- int8量化
trtexec --onnx=XX.onnx --saveEngine=model.plan
量化的基本原理及流程可参看懂你的神经网络量化教程:第一讲、量化番外篇、TensorRT中的INT8、tensorRT int8量化示例代码
trtexec --onnx=XX.onnx --saveEngine=model.plan