多媒体重复挖掘:从技术到知识发现
1. 引言
随着数字多媒体内容和服务在广播和互联网领域的广泛传播,多媒体数据挖掘成为将这些资源转化为商业智能的重要技术。多媒体重复挖掘(MDM)应运而生,它主要用于从多媒体资源测试集中检测图像、视频或音频的副本。MDM 在数字版权管理、电视广告监测、新闻故事检索等多个领域都有重要应用。
2. 重复挖掘方法的选择标准
选择合适的重复挖掘方法具有一定难度,因为目前可用的方法众多,且重复的定义通常具有主观性,在一定程度上取决于具体的应用场景。主要分为以下两种类型:
2.1 精确重复挖掘
精确重复指的是从原始资源中衍生出来的、没有或仅有极少变换的视频或音频副本,如电视广告和新闻中使用的文件素材。大多数现有研究引入了指纹或“哈希”函数的概念,通过对视频采样帧计算指纹来构建哈希表,利用哈希碰撞高效检索近似相同的帧。通常采用高密度采样,以确保检测的精确性,常用的视频描述包括颜色直方图、序数签名、颜色矩等。
2.2 近似重复挖掘
近似重复是指源自同一原始源的视频或图像的轻微改动版本,这些改动通过各种光度或几何变换获得,如摄像录制、画中画、图案插入等。由于视频或图像可能发生强烈变换,在检测近似重复时,基于指纹的哈希碰撞攻击过程的假设变得过于薄弱。大多数现有研究使用图像距离度量来寻找近似相同的图像,通过比较图像在颜色、纹理和形状等多个维度的相似度。图像可以用单个全局特征或多个小的局部特征表示,局部描述在处理短且变换强烈的重复视频时具有更强的判别能力。
以下是精确重复挖掘和近似重复挖掘的对比表格:
| 类型 | 定义 | 挖掘方法 | 常用描述 |
超级会员免费看
订阅专栏 解锁全文
2168

被折叠的 条评论
为什么被折叠?



