一、背景
由于项目需要进行【交通标志检测】,我们选择TT100K数据集作为我们的训练测试数据集。又因为使用的目标检测网络为YOLO系列,所以需要将TT100K数据集的标注转换成yolo格式的标注,并根据项目需要,将TT100K数据集的交通标志分类分为3类:指示标志(标签为1,对应原数据集“i”开头的类别)、禁令标志(标签为2,对应原数据集“p”开头的类别)、警告标志(标签为3,对应原数据集“w”开头的类别)。
二、TT100K数据集标注文件解析
TT100K数据集的标注文件为annotation.json文件,打开后发现标注文件是以字典的格式储存标注信息,字典的组织如下所示:
{
"imgs":
{
'32773':
{'path': 'test/32773.jpg',
'objects':
[
{'category': 'ph2',
'bbox': {'xmin': 924.0, 'ymin': 1132.0, 'ymax': 1177.3333, 'xmax': 966.6667},
'ellipse_org': [[942.725, 1132.14], [926.19, 1144.18], [922.884, 1156.61], [931.746, 1173.02], [949.471, 1174.07], [959.921, 1169.58], [962.037, 1142.72]],
'ellipse': [[943.6439208984375, 1154.060791015625], [41.572391510009766, 45.09551239013672], 36.37429428100586]},
{'category': 'p11',
'bbox': {'xmin': 970.667, 'ymin':