OpenVINO在iGPU上加载模型比CPU慢

部署运行你感兴趣的模型镜像

官方解答地址:

为什么模型加载时间比 CPU 长? (intel.cn)

总结

快速步骤以改善 GPU 上的模型加载时间

说明

将输入模型的中间表示 (IR) 加载到 GPU 需要的时间比将相同模型加载到 CPU 还要长。

解决方法

在应用程序的工作目录中手动创建cl_cache目录。

驱动程序将使用此目录存储已编译内核的二进制表示形式。这将适用于所有受支持的操作系统。

其他信息:

有关管理cl_cache的更多信息,请参阅本文 

将输入模型加载到中间表示 (IR) 格式到 GPU 需要的时间比将同一模型加载到 CPU 需要更长的时间,因为 GPU 堆栈基于 OpenCL*。加载时间取决于 OpenCL* 内核的编译时间。

当您启用 cl_cache时,第一次加载模型仍需花费很长时间,因为 OpenCL* 内核将进行编译。但是,同一模型的每一次加载速度将大大提高

您可能感兴趣的与本文相关的镜像

Wan2.2-I2V-A14B

Wan2.2-I2V-A14B

图生视频
Wan2.2

Wan2.2是由通义万相开源高效文本到视频生成模型,是有​50亿参数的轻量级视频生成模型,专为快速内容创作优化。支持480P视频生成,具备优秀的时序连贯性和运动推理能力

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值