图像分类与3D姿态估计方法研究
在当今的计算机视觉领域,图像分类和3D姿态估计是两个重要的研究方向。本文将介绍一种增量结构化部件模型用于图像分类,以及一种基于金字塔结构、方面图和检查点的3D姿态估计方法。
增量结构化部件模型的图像分类
数据集与实验设置
为了评估增量结构化部件模型的性能,研究人员在两个广泛使用的数据集上进行了实验,分别是Caltech - 256和Pascal VOC 2007。Caltech - 256数据集包含256个类别共30,607张图像,每个类别至少有80张图像;Pascal VOC 2007数据集由20个类别的9,963张图像组成,这些图像中的物体处于杂乱场景中,视角、光照和物体外观有很大变化。在实验前,每张图像被调整为小于300×300像素且保持宽高比不变。
| 数据集 | 类别数量 | 图像数量 | 特点 |
|---|---|---|---|
| Caltech - 256 | 256 | 30,607 | 每个类别至少80张图像 |
| Pascal VOC 2007 | 20 | 9,963 | 物体处于杂乱场景,视角、光照和外观变化大 |
超级会员免费看
订阅专栏 解锁全文
1130

被折叠的 条评论
为什么被折叠?



