2、多媒体重复挖掘：从技术到知识发现

最新推荐文章于 2025-10-09 16:13:37 发布

QuietPulse

最新推荐文章于 2025-10-09 16:13:37 发布

阅读量25

点赞数

CC 4.0 BY-SA版权

分类专栏：多媒体安全技术：从理论到实践文章标签：多媒体重复挖掘精确重复挖掘近似重复挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/c2d3e4f/article/details/149734738

多媒体安全技术：从理论到实践专栏收录该内容

21 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

多媒体重复挖掘：从技术到知识发现

1. 引言

随着数字多媒体内容和服务在广播和互联网领域的广泛传播，多媒体数据挖掘成为将这些资源转化为商业智能的重要技术。多媒体重复挖掘（MDM）应运而生，它主要用于从多媒体资源测试集中检测图像、视频或音频的副本。MDM 在数字版权管理、电视广告监测、新闻故事检索等多个领域都有重要应用。

2. 重复挖掘方法的选择标准

选择合适的重复挖掘方法具有一定难度，因为目前可用的方法众多，且重复的定义通常具有主观性，在一定程度上取决于具体的应用场景。主要分为以下两种类型：

2.1 精确重复挖掘

精确重复指的是从原始资源中衍生出来的、没有或仅有极少变换的视频或音频副本，如电视广告和新闻中使用的文件素材。大多数现有研究引入了指纹或“哈希”函数的概念，通过对视频采样帧计算指纹来构建哈希表，利用哈希碰撞高效检索近似相同的帧。通常采用高密度采样，以确保检测的精确性，常用的视频描述包括颜色直方图、序数签名、颜色矩等。

2.2 近似重复挖掘

近似重复是指源自同一原始源的视频或图像的轻微改动版本，这些改动通过各种光度或几何变换获得，如摄像录制、画中画、图案插入等。由于视频或图像可能发生强烈变换，在检测近似重复时，基于指纹的哈希碰撞攻击过程的假设变得过于薄弱。大多数现有研究使用图像距离度量来寻找近似相同的图像，通过比较图像在颜色、纹理和形状等多个维度的相似度。图像可以用单个全局特征或多个小的局部特征表示，局部描述在处理短且变换强烈的重复视频时具有更强的判别能力。

以下是精确重复挖掘和近似重复挖掘的对比表格：
| 类型 | 定义 | 挖掘方法 | 常用描述 |

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。