使用openvino加速resnet50在VOC2007上的推断结果

在Win10环境下,利用Intel i5-8300H CPU,通过OpenVINO的DL Workbench分析了ResNet50模型在VOC2007数据集上的推断性能。随着batch_size增加,延迟和fps起初同步提升,但在达到CPU性能瓶颈后,fps不再增加,延迟继续上升。多核情况下,尽管核数增加,但由于CPU间通信成本,最优batch_size反而降低,且fps提升不显著。建议采用并行网络结构减少通信时间损耗。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

平台是win10,cpu是Intel® Core™ i5-8300H CPU @ 2.30GHz(一共4核,在这里分配了最多3核做推断),工具是openvino的DL Workbench。

下图的点从左至右的batch_size依次为1、16、32、48和64。
在这里插入图片描述
这是cpu核数为1时的推断结果图。

可以看出,随着batch_size的增加,延迟和fps均增加,直到在某个值后,fps不再增加,仅延迟增加。我们知道,推断的延迟和fps是一组矛盾的数据:在给定cpu时,低延迟往往意味着低fps(因为要尽量快地对输入图片进行反应,就会导致cpu性能不能得到充分的应用),而高fps则往往意味着高延迟(尽可能地利用cpu的性能使得单位时间推断的图片数更多,则往往会导致图片的平均等待时间即延迟的提升)。

所以上图左边曲线的增长是很科学的。而在右侧,fps不再增加,而延迟继续增长,这是因为batch_size的增长已经触及了cpu性能的上限。在这个时候,继续增加batch_size并不能增加fps,反而因为要处理的图片数增加,而增加推断的延迟。

在这里插入图片描述
上图是cpu核数为3时的结果。其基本形状与cpu核数为1时基本一致,原因在上面已有过阐述。但区别在于,在cpu核数为1时,fps的增长在batch_size为32左右时达到了极限,而

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值