TF-TRT通过对基于tensorflow提供服务的模型进行优化后用于inference。使用方式详见examples。本文主要展示其用途及tensorrt与tensorflow间的版本对应关系。 基于saved_model.pb工作流程如下。 图片来自 这里 基于freeze_graph.pb的工作流程如下。 图片来自 这里