KITTI目标跟踪数据集是由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创建的一个大规模自动驾驶场景下的计算机视觉算法评测数据集。这个数据集主要用于评估立体图像、光流、视觉测距、3D物体检测和3D跟踪等计算机视觉技术在车载环境下的性能这个数据集包含了在市区、乡村和高速公路等不同场景下采集的真实图像数据。每张图像中最多可能包含15辆车和30个行人,并且包含了各种程度的遮挡与截断情况。整个数据集由389对立体图像和光流图、39.2km的视觉测距序列以及超过200k的3D标注物体的图像组成,所有的数据都是以10Hz的频率进行采样和同步的。在3D目标检测方面,该数据集由7481个训练图像和7518个测试图像以及相应的点云数据组成,包括总共80256个标记对象。这些标记对象进一步细分为不同的类别,如汽车、货车、行人、坐着的行人、自行车骑手、有轨电车以及其他未分类的物体。KITTI数据集是在德国卡尔斯鲁厄进行的,整个采集过程持续了6小时。数据集大约占采集全部数据的25%,其中去除了测试集中相关的数据片段。这些数据按场景可以分为“道路”、“城市”、“住宅区”、“校园”和“行人”五类。采集车形式路径以红蓝黑三种颜色区分GPS信号的质量,其中红色表示精度最高的数据,有RTK矫正;蓝色表示无矫正信号的数据;而黑色则表示缺失GPS信号的数据,这部分数据已经从数据集中剔除。
一、数据集背景
KITTI(Karlsruhe Institute of Technology and Toyota Technological Institute)目标跟踪数据集是为了评估自动驾驶中计算机视觉算法的性能而设计的。自动驾驶汽车需要在复杂多变的道路环境中准确识别、跟踪和预测其他车辆、行人以及其他交通参与者的行为。为了提供这样一个基准测试平台,KITTI数据集应运而生。
二、数据采集
该数据集的数据采集使用了两台彩色相机、两台灰度相机、一个3D激光扫描仪和一个高精度GPS/IMU系统,安装在一辆改装过的丰田普锐斯车上