Places365

数据集:Places Download
代码:places365

数据集

Places 数据集的设计遵循人类视觉认知的原则。 我们的目标是构建视觉知识的核心,可用于训练人工系统以执行高级视觉理解任务,例如场景上下文、对象识别、动作和事件预测以及心理理论推理。Places 的语义类别由它们的功能定义:标签代表环境的入门级。 为了说明这一点,该数据集具有不同类别的卧室或街道等,因为它们的行为方式不同,并且对接下来可能发生的事情(家庭卧室、酒店卧室或托儿所)的预测也不同。

Places 总共包含超过 1000 万张图像,包括 400 多个独特的场景类别。 该数据集每类具有 5000 到 30,000 个训练图像,与现实世界的发生频率一致。使用卷积神经网络 (CNN),Places 数据集允许为各种场景识别任务学习深度场景特征,目的是在以场景为中心的基准测试中建立新的最先进的性能。在这里,我们提供地点数据库和训练有素的 CNN,用于学术研究和教育目的。

Places365 CNNs

在 Places2 数据库上训练的卷积神经网络 (CNN) 可用于场景识别以及用于视觉识别的通用深度场景特征。 我们使用 Caffe 和 PyTorch 共享以下预训练的 CNN。

  • Github page for Places365-CNNs.
  • List of the categories
  • Scene hierarchy
    在此我们将Places365-Standard的数据和Places365-Challenge的数据公开。Places365-Standard 是 Places2 Database 的核心集,用于训练 Places365-CNNs。以后我们会在Places365-Standard上添加其他类型的注释。Places365-Challenge 是 Places2 数据库的竞赛集,与 Places365-Standard 相比,它有 620 万张额外的图像。Places365-Challenge 将用于 Places Challenge 2016。

Data of Places365-Standard

Places365-Standard 中有来自 365 个场景类别的 180 万张训练图像,用于训练 Places365 CNN。验证集中每个类别有 50 张图像,测试集中每个类别有 900 张图像。

  • Places365 Development kit
    请务必阅读随附的 README 文件以了解详细信息。 开发套件包括:

  • High-resolution images

    上述档案中的图像已调整为最小尺寸为 512,同时保留图像的纵横比。 尺寸小于 512 的原始图像保持不变。

  • small images(256*256)

    无论原始纵横比如何,上述档案中的图像都已调整为 256 * 256。

  • small images(256*256) with easy directory structure

    • Train and val images. 21G.
      这些图像是 256x256 图像,在更友好的目录结构中,在 train 和 val 拆分中,图像被组织,例如 train/reception/00003724.jpg 和 val/raft/000050000.jpg。因此,您可以使用 pyTorch 示例脚本直接将网络训练为:python main.py -a resnet18 places365_standard
  • LMDB data for the 256*256 images

Data of Places365-Challenge 2016

与 Places365-Standard 的训练集相比,Places365-Challenge 的训练集有 620 万张额外的图像,导致 Places365 挑战 2016 的训练图像总数达到 800 万张。 验证集和测试集与 Places365-Standard一样.

  • High-resolution images

    上述档案中的图像已调整为最小尺寸为 512,同时保留图像的纵横比。 尺寸小于 512 的原始图像保持不变。

  • Small images(256*256)

Data ofPlaces-Extra69

除了上面Places365中发布的365个场景类别外,这里我们将额外的69个场景类别(Places Database中共有434个场景类别)的图像数据发布为Places-Extra69。Places-Extra69的分类列表在这里。压缩文件中有train和test的分割。 对于每个类别,我们留下 100 张图像作为测试图像。 有 98,721 张图像用于训练,6,600 张图像用于测试。

Evaluation Server of Places365

您可以通过评估服务器注册提交对Places365测试集的预测。

场景分类(365+69=434类)

- airfield 0 机场
- airplane_cabin 1 飞机舱
- airport_terminal 2 机场航站楼
- alcove 3 壁龛
- alley 4 胡同
- amphitheater 5 圆形剧场
- amusement_arcade 6 游戏室
- amusement_park 7 游乐园
- apartment_building/outdoor 8 公寓楼/户外
- aquarium 9 水族馆
- aqueduct 10 渡槽
- arcade 11 拱廊
- arch 12- archaelogical_excavation 13 考古发掘
- archive 14 档案
- arena/hockey 15 竞技场/曲棍球
- arena/performance 16 竞技场/表演
- arena/rodeo 17 竞技场/竞技
- army_base 18 军队基地
- art_gallery 19 艺术画廊
- art_school 20 艺术学校
- art_studio 21 艺术工作室
- artists_loft 22 艺术家阁楼
- assembly_line 23 装配线
- athletic_field/outdoor 24 运动场/户外
- atrium/public 25 中庭/公共
- attic 26 阁楼
- auditorium 27 礼堂
- auto_factory 28 自动工厂
- auto_showroom 29 自动陈列室
- badlands 30 荒地
- bakery/shop 31 面包店/商店
- balcony/exterior 32 阳台/外部
- balcony/interior 33 阳台/室内
- ball_pit 34 球坑
- ballroom 35 舞厅
- bamboo_forest 36 竹林
- bank_vault 37 银行金库
- banquet_hall 38 宴会厅
- bar 39 酒吧
- barn 40 谷仓
- barndoor 41 谷仓门
- baseball_field 42 棒球场
- basement 43 地下室
-
### 关于Places365类别在图像分类数据集中 在图像分类领域,Places365 数据集是一个广泛使用的场景识别数据库。该数据集不仅提供了丰富的场景类别标注,还涵盖了来自不同环境下的大量图片实例[^1]。 #### 场景覆盖范围 Places365 的注解图像包含了源自SUN和Places数据库中的场景类别。这些类别代表了多种多样的自然和社会环境中可能出现的不同类型的地点或空间配置[^2]。 #### 类别数量与多样性 具体而言,Places365 数据集定义了超过365种不同的场景类别,这使得它成为研究复杂视觉理解任务的理想选择之一。每一种类别都经过精心挑选以确保足够的代表性并尽可能减少重叠度,从而帮助模型更好地学习区分各种独特而复杂的现实世界场景特征。 #### 应用挑战 值得注意的是,在处理此类大规模且高度多样化的数据集时,存在所谓的语义鸿沟问题——即计算机所看到的只是由数值构成的大网格(像素值介于0到255之间),而非人类直观感知到的对象及其属性;因此,构建能够有效跨越这一差距的有效算法至关重要[^3]。 ```python import matplotlib.pyplot as plt from PIL import Image import requests from io import BytesIO # Example code to display an image from Places365 dataset url = "https://example.com/path_to_places365_image.jpg" response = requests.get(url) img = Image.open(BytesIO(response.content)) plt.imshow(img) plt.axis('off') # Hide axes plt.show() ```
评论 7
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值