暴力视频检测与评论方面检测的深度学习方法研究
1. 暴力视频检测相关研究
1.1 背景与问题提出
暴力是使用身体力量对他人造成伤害、心理伤害甚至死亡的行为,是人类冲突的一种极端表现。在过去几十年里,公共暴力,尤其是校园暴力事件在越南等地区显著增加。据越南教育和培训部的数据,一个学年内,学校内外发生了近1600起校园斗殴事件,约5200名学生参与斗殴,11000名学生因斗殴辍学。
目前,大多数暴力检测系统依赖人工检查监控视频,效率低下且不切实际。因此,设计一种能自动从监控摄像头检测暴力行为的应用程序至关重要,它可以帮助教师在早期识别校园暴力并采取预防措施,既减少校园暴力事件,又减轻教师的工作负担。
1.2 相关工作
如今,视频中的暴力检测是研究热点,相关技术可分为两类:
- 基于帧间变化 :由于打斗中的快速动作,包含暴力的帧会发生巨大变化。
- 基于局部运动 :研究人员分析视频中发生的运动变化模式。
许多研究聚焦于识别时空兴趣点并提取特征,如STIP(时空兴趣点)、Harris角点检测器、MoSIFT(运动尺度不变特征变换)、MoWLD(运动韦伯局部描述符)等。此外,还有使用卷积长短期记忆网络(convLSTM)结合一系列卷积和池化层提取特征来检测暴力视频的方法,以及Darknet19模型,它是一个基于ImageNet数据库中超过一百万张图像训练的19层卷积神经网络,能将图像分类为1000多种不同对象。
1.3 方法论
1.3.1 提出的模型
提出的模型
超级会员免费看
订阅专栏 解锁全文
806

被折叠的 条评论
为什么被折叠?



