OpenVINO在iGPU上加载模型比CPU慢

原创已于 2024-06-25 14:59:00 修改 · 642 阅读

·

5

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#openvino #人工智能

于 2024-06-25 14:58:20 首次发布

OpenVINO+AI 专栏收录该内容

1 篇文章

订阅专栏

部署运行你感兴趣的模型镜像

官方解答地址：

为什么模型加载时间比 CPU 长？ (intel.cn)

总结

快速步骤以改善 GPU 上的模型加载时间

说明

将输入模型的中间表示（IR）加载到 GPU 需要的时间比将相同模型加载到 CPU 还要长。

解决方法

在应用程序的工作目录中手动创建cl_cache目录。

驱动程序将使用此目录存储已编译内核的二进制表示形式。这将适用于所有受支持的操作系统。

其他信息：

有关管理cl_cache的更多信息，请参阅本文。

将输入模型加载到中间表示（IR）格式到 GPU 需要的时间比将同一模型加载到 CPU 需要更长的时间，因为 GPU 堆栈基于 OpenCL*。加载时间取决于 OpenCL* 内核的编译时间。

当您启用 cl_cache时，第一次加载模型仍需花费很长时间，因为 OpenCL* 内核将进行编译。但是，同一模型的每一次加载速度将大大提高

您可能感兴趣的与本文相关的镜像

Wan2.2-I2V-A14B

Wan2.2-I2V-A14B

图生视频

Wan2.2

Wan2.2是由通义万相开源高效文本到视频生成模型，是有50亿参数的轻量级视频生成模型，专为快速内容创作优化。支持480P视频生成，具备优秀的时序连贯性和运动推理能力

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。