信息推理的上下文敏感标签扩展与高效子图相似全匹配
信息推理的上下文敏感标签扩展
在图像标签扩展领域,为了实现更有效和完整的标签扩展,研究人员提出了利用信息推理模型的新方法。
实验设置
- 图像数据集 :通过在Flickr上使用“water”、“nature”、“outdoor”、“river”和“environment”等关键词进行搜索,构建图像语料库。经过词干提取、去除停用词(如“the”)、相机型号(如“Canon”)、数字和其他无意义的词后,收集了97,622张不同的图像,包含669,470个标签,唯一标签数量为14,785个。同时,从Flickr上收集了时间戳在2008年10月30日至2009年4月1日之间的测试数据集,去除标签少于5个的图像后,得到4,419张不同的测试图像。
- 评估策略 :对于每张测试图像,选取其前1到4个标签作为种子标签,基于这些种子标签应用不同的方法进行标签扩展。假设Flickr用户习惯先输入与图像密切相关的标签,因此选择前几个标签作为种子。以图2中的图像为例,根据初始用户定义的标签作为真实标签,计算不同模型的精度(precision@K)进行性能评估。
graph LR
A[收集图像数据] --> B[数据预处理]
B --> C[构建图像语料库]
C --> D[收集测试数据集]
D --> E[数据筛选]
E --> F[确定种子标签]
F --> G[
超级会员免费看
订阅专栏 解锁全文
866

被折叠的 条评论
为什么被折叠?



