数字图书馆中内容跟踪与语义网技术在异构馆藏中的应用
在当今数字化时代,数字图书馆面临着诸多挑战,其中数字内容保护和异构馆藏的集成访问是两个重要的问题。本文将介绍数字图书馆中有效的内容跟踪方法以及语义网技术在异构馆藏多视图中的应用。
数字内容跟踪:图像与视频复制检测
在数字图书馆中,保护数字内容的版权至关重要,而内容跟踪和复制检测是实现这一目标的关键技术。
图像复制检测
图像复制检测将问题转化为二分类问题,采用高斯混合模型(GMM)来解决。GMM的定义为:
[
\sum_{j = 1}^{k} w_{j} g(x|\lambda_{j}) = f(x|\theta)
]
其中,(g(x|\lambda_{j})) 是多元高斯分布,(\lambda = (u,\Sigma)) 是高斯分量参数集,(w_{j}) 是第 (j) 个分量的权重,(k) 是高斯分量的数量,(\theta = {w_{j}, \lambda_{j} | j = 1,2,\ldots,k}) 是模型的参数集。
为了学习每个类别的GMM模型,使用期望最大化(EM)算法来收敛到参数集的最大似然估计。选择聚类数 (k) 是训练GMM的关键因素。在本方法中,最初将 (k) 设置为类别数,并继续添加聚类,直到对数似然要么开始下降,要么增加量小于特定阈值。
在实验中,将Kim的DCT序数测量方法作为比较基础。通过Stirmark 4.0生成测试数据,包括预学习的7种图像攻击和6种新攻击。使用精度率、召回率和F-measure来评估性能,结果表明,基于扩展特征的高斯混合分类器在精度、召回率和F-measure上都优于纯DCT
超级会员免费看
订阅专栏 解锁全文
1482

被折叠的 条评论
为什么被折叠?



