【科普文章】当下工业界广泛使用的几种深度学习模型部署技术

QuietNightThought

已于 2023-06-08 14:36:42 修改

阅读量6.8k

点赞数

分类专栏： 30天从入门到精通TensorFlow1.x 文章标签：深度学习 tensorflow

于 2023-06-08 14:31:33 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/shdabai/article/details/131107192

版权

30天从入门到精通TensorFlow1.x 专栏收录该内容

9 篇文章

订阅专栏

文章介绍了多个深度学习推理工具，包括TensorFlowServing（Google的模型服务框架）、ONNXRuntime（Microsoft的跨平台推理引擎）、TensorRT（NVIDIA的高性能GPU推理库）、TFLite（Google的轻量级移动推理库）、OpenVINO（Intel的多架构推理引擎）以及TVM（一个基于LLVM的深度学习编译器）。这些工具专注于模型部署、性能优化和不同硬件环境的支持。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

1. `TensorFlow Serving`：
2. `ONNX Runtime`：
3. `TensorRT`：
4. `TFLite`：
5. `OpenVINO`：
6. `TVM`：

1. `TensorFlow Serving`：

是 Google 推出的 TensorFlow 模型部署和服务化框架，能够将 TensorFlow 模型作为服务提供给客户端，并支持高效的多并发请求。

2. `ONNX Runtime`：

是 Microsoft 推出的深度学习推理引擎，支持 ONNX 模型的跨平台部署和优化。

3. `TensorRT`：

是 NVIDIA 推出的针对 NVIDIA GPU 的高性能深度学习推理库，能够通过优化和裁剪神经网络来提高推理性能，并且支持 FP32、FP16 和 INT8 精度下的推理。

4. `TFLite`：

是 Google 推出的针对移动和嵌入式设备的轻量级深度学习推理库，可以将 TensorFlow 模型转换为 TFLite 模型以在移动设备上运行。

5. `OpenVINO`：

是 Intel 推出的深度学习推理引擎，支持多种硬件架构（CPU、GPU、VPU）和多个框架（TensorFlow、Caffe、ONNX 等），适用于边缘设备和 IoT 应用。

6. `TVM`：

是一个基于 LLVM 的深度学习编译器和运行时系统，可以针对不同硬件架构生成高效的代码，并支持多种深度学习框架。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

QuietNightThought 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。