最大的作用是打破固定类别的分类,实现zero-shot 不需要像imagenet一样啊做1000类,或者像Coco一样做80类 在进行识别新物品(不一定要原来数据集中拥有的)时,只需要添加对应的新标签进去即可识别
实现图片特征与文字特征的相似度计算,label只需要对角线的一对图片与文字
扩展应用包括:ai绘图,视频检索,文本生成等
最大的作用是打破固定类别的分类,实现zero-shot 不需要像imagenet一样啊做1000类,或者像Coco一样做80类 在进行识别新物品(不一定要原来数据集中拥有的)时,只需要添加对应的新标签进去即可识别
实现图片特征与文字特征的相似度计算,label只需要对角线的一对图片与文字
扩展应用包括:ai绘图,视频检索,文本生成等
您可能感兴趣的与本文相关的镜像
Qwen3-8B
Qwen3 是 Qwen 系列中的最新一代大型语言模型,提供了一整套密集型和专家混合(MoE)模型。基于广泛的训练,Qwen3 在推理、指令执行、代理能力和多语言支持方面取得了突破性进展
5047
3364
131

被折叠的 条评论
为什么被折叠?