Onnxruntime Java loading的内存溢出&持续增长问题

Peter_ch_26

已于 2022-02-16 15:35:57 修改

阅读量2.4k

点赞数 2

分类专栏： PyTorch 深度学习框架文章标签： java 开发语言 onnx onnxruntime deep learning

于 2022-02-16 15:35:11 首次发布

本文链接：https://blog.youkuaiyun.com/c654528593/article/details/122964683

版权

PyTorch 同时被 2 个专栏收录

6 篇文章

订阅专栏

深度学习框架

6 篇文章

订阅专栏

Onnxruntime Java loading的内存溢出&持续增长问题

背景

业务服务内存持续增加，看了一大堆文章分析来分析去也搞明白。

尝试

用jstat，jmap gdb perf MAT等工具分析了jvm的情况，总结一句话堆内内存没问题。问题出在了堆外内存上。

又从github onnxruntime的issue上找到了问题所在 https://github.com/microsoft/onnxruntime/issues?q=memory+leak。

问题原因

OnnxTensor和OrtSession.Result都需要Close的。但是在我之前程序中忽略了这个问题，还以为git repo的example写的try-catch是个多余的，万万没想到这两个类居然都实现AutoCloseable了。

解决方法

创建tensor和那预测结果都用try(onnx相关代码放这){}
手动执行下close。

参考

https://github.com/microsoft/onnxruntime/issues?q=memory+lea
https://juejin.cn/post/6844903810398158862
https://www.jianshu.com/p/d23e7197d3fa

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Peter_ch_26

关注关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
8
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【详解】java开发中内存溢出的排查与解决

qu1210的博客

03-18

1161

监控与发现：设置合适的监控和告警，及时发现问题分析与定位：使用专业工具分析堆转储和GC日志，定位根本原因解决与优化：针对不同类型的内存问题采取相应措施预防与改进：建立最佳实践，从代码和架构层面预防内存问题通过合理的内存管理和及时的问题排查，可以有效避免和解决Java应用中的内存溢出问题，保证系统的稳定性和可靠性。

使用onnxruntime-web 运行yolov8-nano推理

m0_74823490的博客

12-19

977

ONNX 是一种开放的格式，可以在不同的深度学习框架之间共享模型，如 PyTorch、TensorFlow、MXNet 和 Caffe2。ONNX 模型在推理时通常能够实现更高的效率，特别是在使用 ONNX Runtime 时。YOLOv8n 是 YOLOv8 系列中的 “nano” 版本，通常是指模型较小，参数较少，计算需求低。创建一个形状为 const modelInputShape = [1, 3, 640, 640]的空张量，并运行一次模型以进行预热，确保模型准备就绪。首先需要下载这两个模型。

8 条评论您还未登录，请先登录后发表或查看评论

onnxruntime-1.5.2.jar

12-03

onnx的java包，pom引入后可以试验java调用onnx文件进行cpu模型推理。具体见https://github.com/microsoft/onnxruntime/blob/master/java/src/test/java/sample/ScoreMNIST.java 和 https://github.com/microsoft/onnxruntime/blob/master/docs/Java_API.md#getting-started

使用 onnxruntime-gpu 进行推理，运行时间久显存逐渐递增无法减少

xiao_ling_yun的博客

06-26

2772

将onnx模型部署为接口后，使用 onnxruntime-gpu 进行持续推理，运行时间久显存逐渐递增无法减少

C++ onnxruntime多进程/多线程CPU推理时出现内存泄漏问题（memory leak）

观自在的博客

06-08

3536

压测的时候发现，进程的RSS内存一直在上升，就怀疑是onnxruntime导致的。因此，没加模型推理前，是不存在内存泄漏的。不知道，还没看出来。但估计可能是多线程/进程环境中mem会发送竞争吧。,可以解决内存泄漏的问题。后，额外添加一个配置项。

Android内存泄漏就这样产生了

guoyiqi

02-01

164

1.资源对象没关闭造成的内存泄漏描述：资源性对象比如（Cursor，File文件等）往往都用了一些缓冲，我们在不使用的时候，应该及时关闭它们，以便它们的缓冲及时回收内存。它们的缓冲不仅存在于java虚拟机内，还存在于java虚拟机外。如果我们仅仅是把它的引用设置为null,而不关闭它们，往往会造成内存泄漏。因为有些资源性对象，比如SQLiteCursor（在析构函数finalize(),如...

JAVA onnxruntime 调用ONNX模型进行预测

bailanren的博客

03-31

1052

JAVA onnxruntime 调用ONNX模型进行预测

ComfyUI插件ComfyUI layer style节点安装(含onnxruntime编译)，吐血推荐

weixin_43867038的博客

09-29

2565

ComfyUI_Layer_Style节点安装时，基本可以按照Github上的readme来，有中文的说明，也算方便但是部署之后，节点总是起不来，查看日志，发现是缺少onnxruntime，于是开始了痛苦之旅。

historical内存溢出问题及解决方案

weixin_43172032的博客

12-14

1148

一，问题描述 druid router界面显示historical服务不正常，Datasource0%可用，druid历史数据不可查。historical节点日志显示一直在loading segment，但是loading结束后可能会报错segment文件格式错误，如下图，报错的文件路径本地可能没有但是hdfs上文件没问题。报错后过一会儿又开始重新开始loading过程，如此往复循环。 druid目录下有进程崩溃的日志。二，问题原因查看hs_err_pid文件可知historical进程死掉的原因是

【JVM系列8】JVM经典面试问题(内存溢出和内存泄露)解答及调优实战分析

zwx900102的博客

08-30

3542

JVM经典面试问题解答及调优实战分析前言常见问题及调优实战1、内存泄漏与内存溢出的区别2、如何防止内存泄露3、GCRoot不可达的对象一定会被回收吗4、Young GC会有STW吗5、Major GC和Full GC的区别6、方法区会发生GC吗7、什么是直接内存8、CMS收集器和G1收集器的区别9、类加载机制经过哪些步骤10、系统CPU经常100%，如何定位总结前言 JVM系列介绍到这里，其实理论知识和基本工具的使用基本上都介绍过了，当然，JVM的理论知识也不仅仅只是这些，如果想要更深入的里面还是会有很多

onnxruntime-1.10.0-1.5.7-API文档-中英对照版.zip

07-03

赠送jar包：onnxruntime-1.10.0-1.5.7.jar；赠送原API文档：onnxruntime-1.10.0-1.5.7-javadoc.jar；赠送源代码：onnxruntime-1.10.0-1.5.7-sources.jar；赠送Maven依赖信息文件：onnxruntime-1.10.0-1.5.7.pom；包含翻译后的API文档：onnxruntime-1.10.0-1.5.7-javadoc-API文档-中文(简体)-英语-对照版.zip； Maven坐标：org.bytedeco:onnxruntime:1.10.0-1.5.7；标签：bytedeco、onnxruntime、中英对照文档、jar包、java；使用方法：解压翻译后的API文档，用浏览器打开“index.html”文件，即可纵览文档内容。人性化翻译，文档中的代码和结构保持不变，注释和说明精准翻译，请放心使用。双语对照，边学技术、边学英语。

使用ONNX Runtime在Java Web应用中部署深度学习模型

shysea2019的博客

03-27

7147

当应用场景需要集成深度学习模型进行推理时，直接在Java Web应用中集成深度学习框架可能会面临性能、兼容性等问题。为了将深度学习模型无缝集成到Java Web应用中，是一项广受认可且实用的方法。本篇文档将介绍如何将模型转换为ONNX格式，并通过ONNX Runtime Server进行部署，并通过Java Web应用调用以进行回归或预测任务。本方案的主要目标是实现以下功能：将PyTorch模型转换为ONNX格式。部署ONNX Runtime Server，加载ONNX模型并提供推理服务。

ONNX格式模型学习笔记 (onnxRuntime部署)---用java调用yolov8模型来举例

热门推荐

qq_48050838的博客

12-24

1万+

ONNX（Open Neural Network Exchange）是一个开源项目，旨在建立一个开放的标准，使深度学习模型。ONNX模型可以用于各种应用场景，例如机器翻译、图像识别、语音识别、自然语言处理等。由于ONNX模型的互操作性，开发人员，例如从PyTorch转换到TensorFlow，或从TensorFlow转换到MXNet等。，例如云端、边缘设备或移动设备等。ONNX还提供了一组工具和库，帮助开发人员。

java加载onnxruntime.dll报错Can‘t find dependent libraries

IamJavaStar的专栏

08-11

2032

通过工具depends.exe查看所需要的依赖，并下载放到jdk的bin目录下。其中依赖api-ms-win-core-libraryloader-l1-2-0.dll只有x86版本，解决办法只需要复制api-ms-win-core-libraryloader-l1-1-0.dll并重命名为api-ms-win-core-libraryloader-l1-2-0.dll即可。 ...

算法部署之内存泄露（gunicorn+flask+onnx+pytorch）

hdudb的博客

08-17

2454

Gunicorn（Green Unicorn），flask+算法内存泄露解决办法。

java调用onnx模型_微软宣布开源ONNX.js，可在浏览器上运行ONNX模型

weixin_39888807的博客

12-22

700

ONNX.js是一个Java库，用于在浏览器和Node.js上运行ONNX模型。ONNX.js采用了WebAssembly和WebGL技术，为CPU和GPU提供优化的ONNX模型推理runtime。为何选择ONNX模型在开放式神经网络交换(Open Neural Network Exchange ，ONNX)是一个开放的标准，代表机器学习模型。ONNX的最大优势在于它允许跨不同开源AI框架的互操作...

【AI芯片】ONNXRuntime

qq_35608277的博客

05-13

1948

ONNXRuntime是微软推出的一款推理框架，用户可以非常便利的用其运行一个onnx模型。ONNXRuntime支持多种运行后端包括CPU，GPU，TensorRT，DML等。可以说ONNXRuntime是对ONNX模型最原生的支持。虽然大家用ONNX时更多的是作为一个中间表示，从pytorch转到onnx后直接喂到TensorRT或MNN等各种后端框架，但这并不能否认ONNXRuntime是一款非常优秀的推理框架。而且由于其自身只包含推理功能（最新的ONNXRuntime甚至已经可以训练），通过阅读其

使用Java ONNXRuntime进行语义相似度计算

yuchunlei的专栏

06-16

588

使用Java进行文本语义相似度计算, ONNXRuntime, Deep Java Library

java轻易不会发生内存泄露_（五十八）java中是否存在内存泄漏问题

weixin_32920055的博客

02-27

102

一、概念：无用对象、未被引用对象、被引用对象我们需要先了解一下对象在内存中的状态。下面的这张图就解释了什么是无用对象以及什么是未被引用对象。上面图中可以看出，里面有被引用对象和未被引用对象。未被引用对象会被垃圾回收器回收，而被引用的对象却不会。未被引用的对象当然是不再被使用的对象，因为没有对象再引用它。然而无用对象却不全是未被引用对象。其中还有被引用的。就是这种情况导致了内存泄漏。二、内存泄漏与内...

onnxruntime-1.15.0 cpu c++