核心摘要
bind_ortvalue_output 是 ONNX Runtime 提供的一个 API 函数。它的主要作用是将一个 Ort::Value 对象绑定到模型推理的某个输出节点上。这样做的好处是,ONNX Runtime 会将模型的推理结果直接输出到您提供的这个 Ort::Value 中,而不是在内部创建一个新的 Ort::Value 再返回给你。
这通常用于避免不必要的数据拷贝,提升推理性能,尤其是在高性能或低延迟的应用场景中。
详细功能解释
要理解它的功能,我们最好对比一下使用和不使用它的区别。
1. 常规流程(不使用 bind_ortvalue_output)
在常规的模型推理中,流程是这样的:
-
准备输入:创建
Ort::Value对象,并填充好输入数据。 -
准备输出:通常只指定输出节点的名称,不提供具体的输出容器。
-
运行推理:调用
Run方法。 -
获取输出:
Run方法会在内部为每一个输出节点新创建一个Ort::Value对象,并将计算结果填充进去,最后将这些对象返回给你。
cpp
//

最低0.47元/天 解锁文章
728

被折叠的 条评论
为什么被折叠?



