引用
Chen S C, Shyu M L, Chen M, et al. A decision tree-based multimodal data mining framework for soccer goal detection[C]//2004 IEEE International Conference on Multimedia and Expo (ICME)(IEEE Cat. No. 04TH8763). IEEE, 2004, 1: 265-268.
摘要
本文提出了一种新的多媒体数据挖掘框架,该方法通过结合多模态分析和决策树逻辑来提取足球视频中的足球进球事件,提取的事件可用于索引足球视频。我们首先采用一种先进的视频镜头检测方法来产生镜头边界和一些重要的视觉特征;然后为每个镜头以不同的粒度提取视觉/音频特征,通过预过滤步骤对丰富的多模式功能集进行过滤,以清除噪声并减少无关数据。决策树模型建立在清理的数据集上,并用于对射门进行分类。最后,实验结果证明了本系统的足球目标提取框架的有效性。
1 介绍
近年来,在体育视频数据,尤其是足球视频中挖掘信息已成为一个活跃的研究主题。对于足球视频分析和事件识别,大多数现有工作都是基于单峰方法。不难看出,在足球目标检测应用领域中,不同的模式有不同的贡献。随着多模态方法显示出其希望,它还提出了如何处理大量多模态特征中包含的丰富语义信息的问题。在现有研究中,提出了一种使用隐马尔可夫模型检测和识别足球亮点的数据挖掘方法。但是,它无法识别目标事件,并且存在处理长视频序列的问题。
长期以来,数据挖掘技术一直被用来从大型数据集中发现有趣的模式。在本文中,我们提出了一种基于决策树的多模态数据挖掘框架,用于足球目标检测。 用于数据挖掘的训练数据是为每个视频镜头提取的多模态特征(视觉和音频)。它是基于镜头的,因为视频镜头是视频内容分析的基本索引单位。此外,我们采用了先进的视频镜头检测方法,其优点是在镜头检测期