网络视频事件挖掘中的特征轨迹研究
1. 引言
随着网络视频的爆炸式增长,高效掌握主要事件的需求变得十分迫切。然而,网络视频场景具有独特的特点,如特征数量有限、近重复关键帧检测存在不可避免的误差以及文本信息嘈杂等,这使得网络视频事件挖掘成为一项具有挑战性的任务。
特征轨迹在主题检测和跟踪方面表现出了良好的性能,它通过结合时间信息将活动建模为突发模式。在二维的时间 - 频率空间中,文本的演变被建模为一组特征轨迹,用于事件聚类。但与传统文本文档不同,网络视频的文本信息(标题和标签)较少且嘈杂、模糊、不完整甚至具有误导性,这可能导致从有限的标题和标签中提取的文本特征轨迹与传统文档有所不同。
另一方面,重要的视觉镜头常被插入相关视频中,类似于文本领域的热门词汇。近重复镜头/关键帧包含有用的视频内容,可用于将主题相似的视频分组为事件。虽然已有研究探索了基于近重复关键帧的视觉特征轨迹来挖掘网络视频的事件结构,但对其可行性和鲁棒性的分析还不够充分,且文本和视觉特征轨迹之间的关系也尚未得到研究。
2. 相关工作
2.1 主题检测和跟踪
事件挖掘属于信息检索中主题检测和跟踪(TDT)的任务范畴。TDT 的目标是在文本新闻流中检测新主题并跟踪已知事件。在文本领域已经有很多相关研究,近年来,TDT 研究也扩展到了多媒体领域。例如,通过视觉重复和语义概念跟踪主题,利用文本相关性和关键帧匹配对主题进行聚类,通过二分图构建故事与文本 - 视觉概念之间的对偶关系来发现主题,以及在近重复关键帧约束下通过基于约束的协同聚类将新闻故事聚类为主题等。
2.2 特征轨迹
特征轨迹在文本领域是一个重要特征。以往的
超级会员免费看
订阅专栏 解锁全文
985

被折叠的 条评论
为什么被折叠?



