2、多媒体重复挖掘:从技术到知识发现

多媒体重复挖掘:从技术到知识发现

1. 引言

随着数字多媒体内容和服务在广播和互联网领域的广泛传播,多媒体数据挖掘成为将这些资源转化为商业智能的重要技术。多媒体重复挖掘(MDM)应运而生,它主要用于从多媒体资源测试集中检测图像、视频或音频的副本。MDM 在数字版权管理、电视广告监测、新闻故事检索等多个领域都有重要应用。

2. 重复挖掘方法的选择标准

选择合适的重复挖掘方法具有一定难度,因为目前可用的方法众多,且重复的定义通常具有主观性,在一定程度上取决于具体的应用场景。主要分为以下两种类型:

2.1 精确重复挖掘

精确重复指的是从原始资源中衍生出来的、没有或仅有极少变换的视频或音频副本,如电视广告和新闻中使用的文件素材。大多数现有研究引入了指纹或“哈希”函数的概念,通过对视频采样帧计算指纹来构建哈希表,利用哈希碰撞高效检索近似相同的帧。通常采用高密度采样,以确保检测的精确性,常用的视频描述包括颜色直方图、序数签名、颜色矩等。

2.2 近似重复挖掘

近似重复是指源自同一原始源的视频或图像的轻微改动版本,这些改动通过各种光度或几何变换获得,如摄像录制、画中画、图案插入等。由于视频或图像可能发生强烈变换,在检测近似重复时,基于指纹的哈希碰撞攻击过程的假设变得过于薄弱。大多数现有研究使用图像距离度量来寻找近似相同的图像,通过比较图像在颜色、纹理和形状等多个维度的相似度。图像可以用单个全局特征或多个小的局部特征表示,局部描述在处理短且变换强烈的重复视频时具有更强的判别能力。

以下是精确重复挖掘和近似重复挖掘的对比表格:
| 类型 | 定义 | 挖掘方法 | 常用描述 |

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值