基于CNN - LSTM的物联网监控网络视频摘要框架
1. 引言
在当今信息爆炸的时代,视觉格式的信息在互联网上丰富且广泛可得。视觉呈现虽能有效传达信息且便于记忆,但也存在诸多弊端。原始视觉数据占用大量存储空间,进行特定事件查询或提取相似视觉表示等任务时,需要对大量视觉数据进行分析。在特定视频应用中,传输和分析完整视频既耗时又不切实际。因此,在传输前对视频进行摘要处理显得尤为必要。
视频摘要能够从视频中选取具有代表性的场景,生成反映视频连续性、避免重复和冗余的摘要,让用户在不完整观看视频的情况下了解其核心内容。这一技术可用于模式分析、战略决策等多种任务,在视频和图像起关键作用的各个领域,如室内外/工业监控视频摘要、电影及各类活动和仪式的摘要等,都具有重要价值。
在监控领域,视频摘要的作用更为显著。现代监控行业提供的解决方案远超基本的报警功能,组织能够访问监控视频的实时流,并及时采取保护或安全措施。将物联网(IoT)和深度学习应用于监控领域是未来的发展趋势,本文提出了一种将“智能设备”与人工智能(AI)相结合的监控框架,建议在物联网环境中使用轻量级的卷积神经网络(CNN)和长短期记忆网络(LSTM)进行视频摘要处理。
1.1 主要贡献
- 回顾了物联网和深度学习技术在不同应用领域处理视频和图像的方法。
- 深入研究文献,确定了物联网和深度学习环境的关键特征,以便在物联网框架中应用深度学习技术。
- 提出了一个四层的视频摘要框架。
- 探讨了深度学习和物联网融合领域的挑战及未来研究方向。
2. 文献综述
不同作者提
超级会员免费看
订阅专栏 解锁全文
101

被折叠的 条评论
为什么被折叠?



