提升网络图像检索与故事链接检测技术解析
提升网络图像检索
在当今数字化时代,网络图像检索技术至关重要。目前,网络图像检索系统主要分为基于文本和基于内容两类。
基于文本的系统,需先为图像添加文本注释,这些注释可由人工手动完成,也可从图像周围环境自动提取,随后运用文本检索技术进行图像检索。然而,手动注释图像不仅繁琐、耗时,还具有主观性;而自动从周围环境提取注释,又难免包含与图像语义无关的术语。基于内容的图像检索(CBIR)系统则通过图像的低级视觉特征自动对图像进行索引,但它也存在缺陷。首先,用户查询必须以所需图像的草稿形式提供;其次,具有相似低级特征的图像可能内容不同;最后,图像的低级特征与高级概念之间存在所谓的语义鸿沟。
为克服这些问题,自动图像注释技术应运而生。但当前最先进的自动图像注释模型仍会产生一些与图像语义无关的概念,这对获取高质量的图像检索构成了障碍。
连续相关性模型(CRM)
为解决上述问题,研究人员提出了连续相关性模型(CRM)。该模型的基本原理是:设 V 为注释词汇表,T 为训练集,J 是 T 的一个元素。J 被划分为一组固定大小的小区域 rJ = {r1, …, rn},以及相应的注释 wJ = {w1, …, wm},其中 wi ∈V 。CRM 假设生成 J 基于三种不同的概率分布:
1. 注释词集合 wJ 是从潜在的多项分布 PV(·|J) 进行 |V| 次独立采样的结果。
2. 每个图像区域 r 是使用基于核的概率密度函数 PG(·|J) 对实值特征向量 g 进行采样的结果。
3. 矩形区域 r 根据以 g 为条件的某个未知分布生成,因此 rJ 是根据一个独立于 J 的过程 PR(ri
超级会员免费看
订阅专栏 解锁全文
7381

被折叠的 条评论
为什么被折叠?



