我们使用以下6个分类标准对本文的研究选题进行分析:
1. 任务类型:
- 图像检索: 最常见任务,目标是检索与给定草图相似的图像。例如:[1, 2, 3, 4, 5, 6, 7, 8, 9, 14, 16, 30, 35, 42, 43, 44, 53, 58, 59, 61, 62, 64, 65, 67, 68, 72, 73]
- 图像生成: 相反,根据草图生成图像。例如:[11, 33]
- 目标检测: 基于草图识别图像中的特定目标。例如:[13]
2. 输入模式:
- 仅草图: 仅使用手绘草图作为输入。例如:[1, 2, 5, 6, 9, 14, 16, 35, 42, 53, 58, 59, 61, 64, 65, 67, 68, 72, 73]
- 草图 + 文本: 同时使用草图和文本描述提高理解。例如:[3, 29, 31, 46, 74, 75]
3. 监督类型:
- 监督学习: 依赖于标记数据,训练过程中提供草图和对应图像对。例如:[26, 34, 48]
- 无监督学习: 不使用标记数据,更具挑战性但更灵活。例如:[1, 2, 5
该研究聚焦于零样本草图图像检索,利用无监督的CLIP深度学习模型,在无标记数据情况下进行细粒度图像检索。通过提示学习和创新设计提升性能,探讨了CLIP在其他草图相关任务中的潜力。
订阅专栏 解锁全文
2530

被折叠的 条评论
为什么被折叠?



