自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

qq_24502827的博客

学习一天8小时不放弃

优快云认证博客专家优快云认证企业博客

码龄10年

10: 原创

57万+: 周排名

23万+: 总排名

2万+: 访问

: 等级

259: 积分

51: 粉丝

134: 获赞

14: 评论

201: 收藏

私信

关注

热门文章

分类专栏

最新评论

报错 ModuleNotFoundError:No module named ‘torch._six‘
2301_80131783: 怎么知道对应版本呀？请问
【文献阅读】VQA入门——Tips and Tricks for Visual Question Answering: Learnings from the 2017 Challenge
nininiiiiii_: 请问，在融合后为什么又把文字和图像分开了，分开中300和2048又代表什么
报错 ModuleNotFoundError:No module named ‘torch._six‘
大龙唉: 很不错，确实有用！
记录一下Ubuntu22.04 pip过程里下载速度慢的解决办法
优快云-Ada助手: 恭喜您又写了一篇有用的博客！您的经验分享一定能帮助更多的Ubuntu用户。建议您下一步可以考虑分享一些Ubuntu系统中常见的问题及解决方法，这会更加实用。再次感谢您的分享！优快云正在通过评论红包奖励优秀博客，请看红包流：https://bbs.youkuaiyun.com/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.youkuaiyun.com/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3
报错 ModuleNotFoundError:No module named ‘torch._six‘
小金金金金鱼: 我这样弄了也不行

VQA论文阅读

关注

文章平均质量分 95

关注数：文章数：1 文章阅读量：256 文章收藏量：0

作者: 学习一天8小时不放弃

这个作者很懒，什么都没留下…

展开

【文献阅读】VQA（1）——Learning Transferable Visual Models From Natural Language Supervision

摘要部分主要说了现在SOTA的经过训练的视觉系统已经可以预测固定的预定对象的类别。这句话其实很好解释：现在做图像分类的时候，你需要提前定义一个大的分类label标签。我做猫狗分类，那么我预测的就是猫or狗；如果做人狗猪马分类，就是做四分类（多分类）任务。如果是这样，那么在二分类上做训练，就不好去迁移到别的任务里面去预测，因为别的任务预测的最后label可能是不同的。就算你训练了一个超级大的视觉模型，来预测十万类别，但是你迁移到别的任务里去，还是有可能别人的任务里没有对应的label。

原创 2023-09-05 10:33:07 · 256 阅读 · 0 评论