Visual Genome数据集
Visual Genome数据集,是由斯坦福大学人工智能实验室主任李菲菲与几位同事合作开发的。
数据集及论文网址:http://visualgenome.org/
一、作者的初衷是什么?为什么要设计出这样一个数据集?
1.作者在视觉领域研究了多年,一直致力于寻求最好的算法,来达到更好的效果。但是受人类对于世界的认识过程的启发,作者认为,教计算机理解图片,其实和教儿童认识世界的过程是类似的。儿童的眼睛就类似一对生物相机,3岁时他已经浏览过数亿张真实世界的图像,这是一个非常庞大的训练数据集。
由此作者认为,不去一味的寻找算法,转而考虑如何构建一个丰富的数据集,或许可以有更好的效果。
2.计算机视觉的行程,最初是感知任务,例如图像分类等,能够达到给图像贴上标签的