当算法需要部署到Intel的CPU上时,几乎可以无脑使用openvino进行模型部署,推理速度是onnxruntime和opencv比不了的(那种很小的模型可能体现不出差距)。而且openvino的官方案例很多,可以参考:GitHub - openvinotoolkit/openvino_notebooks: 📚 Jupyter notebook tutorials for OpenVINO™
为了进一步加快推理速度,可以使用NNCF工具将模型量化为int8,但是量化为int8可能会导致模型精度的损失,最近发现NNCF有一个带精度控制的量化API:nncf.quantize_with_accuracy_control,可以在量化的过程中限制模型精度下降的最大阈值,案例参考:https://github.com/openvinotoolkit/nncf/