ImageNet系列1《ImageNet:A Large-Scale Hierarchical Image Database》
ImageNet系列2《ImageNet Large Scale Visual Recognition Challenge》(待完成)
ImageNet系列2《Scalable multi-label annotation》(待完成)
ImageNet:A Large-Scale Hierarchical Image Database
前言:
2009年李飞飞团队发表,提出了21k的ImageNet基准数据集
ImageNet官网:https://www.image-net.org/challenges/LSVRC/index.php
论文分为摘要、介绍、ImageNet的特性、ImageNet和相关数据集、构造ImageNet、ImageNet应用、未来工作
摘要
(问题)互联网上图像数据的爆炸式增长有可能训练出更复杂、更健壮的模型和算法,用于索引、检索、组织图像和多媒体数据并与之交互,但如何组建数据集是个问题。
(创新点)提出了从WordNet结构构建的大型图片数据集“ImageNet”。
(具体介绍)ImageNet旨在用平均500-1000个干净和高分辨率的图像构成WordNet的8w个同义词(synsets)中的大部分,所以会由WordNet构建ImageNet数千万图片的语义树。ImageNet目前由12个子树、5247个同义词集、320w图片。ImageNet数据集比目前现有数据集更大、多样且准确。我们使用了Amazon Mechanical Turk来搜集数据。
(下游和优势)我们展示了目标识别、图像分类和自动目标聚类方面展示了应用。
1. 介绍
结构: 使用WordNet结构。
具体: WordNet中大约8w个名词同义词,在ImageNet中,我们为每个同义词提供了500-1000个图片。ImageNet包含12个子树:mammal, bird, fish, reptile, amphibian, vehicle, furniture, musical instrument, geological formation, tool, fl

最低0.47元/天 解锁文章
771

被折叠的 条评论
为什么被折叠?



