深度学习-标注文件处理（txt批量转换为json文件）

原创

已于 2024-01-12 20:28:31 修改 · 5k 阅读

38 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #YOLO #json #图像处理 #人工智能 #计算机视觉 #目标检测

于 2024-01-12 18:35:49 首次发布

文章描述了如何将COCO128数据集按照比例划分为训练集、测试集和验证集，并将其转换为标准的COCO格式JSON文件，以便于maskrcnn模型的调试，特别强调了在资源有限的情况下的数据处理优化。

接上篇，根据脚本可将coco128的128张图片，按照比例划分成训练集、测试集、验证集，同时生成相应的标注的labels文件夹，最近再看实例分离比较火的mask rcnn模型，准备进行调试但由于实验室算力不足，网上自己租的2080ti马，传整个coco2017实在是太慢了，检索了一下没有开源的部分coco2017数据集，于是我想到将coco128的数据转化成json文件，便于新手进行debug，节约时间和算力。
在这里插入图片描述
数据集结构准备如上（在我上篇博文的基础上新增classes.txt文件和annotations文件夹）
脚本如下：

import os
import json
import cv2
import random
import time
from PIL import Image

coco_format_save_path='/root/autodl-tmp/deep-learning-for-image-processing-master/pytorch_object_detection/mask_rcnn/data/annotations/'   #要生成的标准coco格式标签所在文件夹
yolo_format_classes_path='/root/autodl-tmp/deep-learning-for-image-processing-master/pytorch_object_detection/mask_rcnn/data/train/classes.txt'     #类别文件，一行一个类
yolo_format_annotation_path='/root/autodl-tmp/deep-learning-for-image-processing-master/pytorch_object_detection/mask_rcnn/data/train/labels/'  #yolo格式标签所在文件夹
img_pathDir='/root/autodl-tmp/deep-learning-for-image-processing-master/pytorch_object_detection/mask_rcnn/data/train/images/'    #图片所在文件夹

with open(yolo_format_classes_path,'r') as fr:                               #打开并读取类别文件
    lines1=fr.readlines()
# print(lines1)
categories=[]                                                                 #存储类别的列表
for j,label in enumerate(lines1):
    label=label.strip()
    categories.append({
   
   'id':j+1,'name':label,'supercategory':'None'})         #将类别信息添加到categories中
# print(categories)

write_json_context=dict()                                                      #写入.json文件的大字典
write_json_context['info']= {
   
   'description': '', 'url': '', 'version': '', 'year': 2024, 'contributor': '纯粹ss', 'date_created': '2024-01-12'}
write_json_context['licenses']=[{
   
   'id':1,'name':None,'url':None}]
write_json_context['categories']=categories
write_json_context['images']=[]
write_json_context['annotations']=[]

#接下来的代码主要添加'images'和'annotations'的key值
imageFileList=os.listdir(img_pathDir)                                           #遍历该文件夹下的所有文件，并将所有文件名添加到列表中
for i,imageFile in enumerate(imageFileList):
    imagePath = os.path.join(img_pathDir,imageFile)                             #获取图片的绝对路径
    image = Image

最低0.47元/天解锁文章