CVPR 2023: CLIP for All Things Zero-Shot Sketch-Based Image Retrieval, Fine-Grained or Not

该研究聚焦于零样本草图图像检索,利用无监督的CLIP深度学习模型,在无标记数据情况下进行细粒度图像检索。通过提示学习和创新设计提升性能,探讨了CLIP在其他草图相关任务中的潜力。

我们使用以下6个分类标准对本文的研究选题进行分析:

1. 任务类型:

  • 图像检索: 最常见任务,目标是检索与给定草图相似的图像。例如:[1, 2, 3, 4, 5, 6, 7, 8, 9, 14, 16, 30, 35, 42, 43, 44, 53, 58, 59, 61, 62, 64, 65, 67, 68, 72, 73]
  • 图像生成: 相反,根据草图生成图像。例如:[11, 33]
  • 目标检测: 基于草图识别图像中的特定目标。例如:[13]

2. 输入模式:

  • 仅草图: 仅使用手绘草图作为输入。例如:[1, 2, 5, 6, 9, 14, 16, 35, 42, 53, 58, 59, 61, 64, 65, 67, 68, 72, 73]
  • 草图 + 文本: 同时使用草图和文本描述提高理解。例如:[3, 29, 31, 46, 74, 75]

3. 监督类型:

  • 监督学习: 依赖于标记数据,训练过程中提供草图和对应图像对。例如:[26, 34, 48]
  • 无监督学习: 不使用标记数据,更具挑战性但更灵活。例如:[1, 2, 5
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

结构化文摘

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值