判别学习辅助的视频语义概念分类
1 引言
随着数字设备的快速发展和广泛使用,越来越多的人喜欢将日常生活记录成视频,并分享到如 YouTube、Yahoo Video 和优酷等网站上。为了更好地理解这些视频数据并从中发现有用的知识,有效且自动的多媒体语义分析变得至关重要。然而,手动分析多媒体数据成本高昂,在时间有限或数据量巨大的情况下甚至不可行。因此,多媒体研究面临着如何有效组织这些视频的挑战。数据挖掘技术为解决这一挑战提供了方案,视频概念分类就是过去 10 年中备受关注的研究领域。
在从视频内容中提取有用知识时,会遇到一些问题:
- 语义鸿沟 :指低层次视觉特征(如颜色、纹理、形状等)与高层次语义概念(如船只、户外、街道等)之间的差距。
- 数据不平衡 :目标概念的视频数量通常远少于非目标概念的视频数量,这会导致分类性能不佳。
- 高维特征空间 :新特征的开发可能导致高维特征空间,容易因“维度灾难”而出现过拟合问题。
为克服这些问题,有两种方法:一是从原始特征空间中选择具有代表性的特征子集,可减少特征空间、提高分类性能和模型的成本效益;二是改进归纳学习技术,构建更强大的分类器,如通过组合弱分类器来实现。
2 相关工作
2.1 特征选择
监督特征选择可分为以下三类:
- 包装器方法 :通过指定学习算法选择具有高预测性能的特征子集,但计算量巨大。
- 嵌入式方法 :将特征选择融入学
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



