CNN大规模视频处理--NoScope: 1000x Faster Deep Learning Queries over Video

针对大量视频流的实时检测需求,NoScope方案通过结合运动检测与专用CNN模型,实现了相较于YOLOv2超过15,000帧/秒的处理速度提升。该方案首先利用差异检测器判断当前帧是否有变化,若无变化则丢弃该帧;若有变化,则通过为每个摄像头定制的小型CNN模型进行检测。对于复杂场景,可回退至完整的CNN模型。

http://dawn.cs.stanford.edu/2017/06/22/noscope/
https://arxiv.org/abs/1703.02529

YOLOv2在视频检测中的效果比较好,但是一个GPU也只能达到每秒几十帧的处理速度。对于上百路视频怎么使用YOLOv2来完成检测和检索的任务了?总不能每一路视频都配置个 GPU吧。这里主要的思路还是先进行运动检测,看看当前帧有没有运动物体models that detect differences (to exploit temporal locality locality),然后再对每个相机训练一个小的 CNN 模型来完成检测任务。models that are specialized to a given feed and object (to exploit scene-specific locality) .
NoScope’s specialized models can run at over 15,000 frames per second compared to YOLOv2’s 80 frames per second

If the difference detector is confident that nothing has changed, NoScope drops the frame; otherwise, if the specialized model is confident in its label, NoScope outputs the label. And, for particularly tricky frames, NoScope can always fall back to the full CNN.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值