Labelme批量转换json文件(基础3)

本文详细介绍了Python的JSON模块,包括dumps和dump用于序列化,loads和load用于反序列化的方法。JSON是一种轻量级的数据交换格式,与Python字典格式相似。dumps将对象转换为JSON格式的字符串,dump将字符串写入文件;loads将JSON字符串转换回Python对象,load从文件读取并反序列化。此外,还对比了JSON和pickle模块的区别以及Python对象与JSON对象的对应关系。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

关于json模块

 

JSON(JavaScript Object Notation, JS 对象标记) 是一种轻量级的数据交换格式。JSON的数据格式其实就是python里面的字典格式,里面可以包含方括号括起来的数组,也就是python里面的列表。

python中,有专门处理json格式的模块—— json picle模块

  Json   模块提供了四个方法: dumpsdumploadsload

pickle 模块也提供了四个功能:dumpsdumploadsload

 

. dumps dump:

 dumpsdump   序列化方法

       dumps只完成了序列化为str

       dump必须传文件描述符,将序列化的str保存到文件中

 

查看源码:

def dumps(obj, skipkeys=False, ensure_ascii=True, check_circular=True,

        allow_nan=True, cls=None, indent=None, separators=None,

        default=None, sort_keys=False, **kw):

    # Serialize ``obj`` to a JSON formatted ``str``.

    # 序列号 “obj” 数据类型 转换为 JSON格式的字符串

def dump(obj, fp, skipkeys=False, ensure_ascii=True, check_circular=True,

        allow_nan=True, cls=None, indent=None, separators=None,

        default=None, sort_keys=False, **kw):

    """Serialize ``obj`` as a JSON formatted stream to ``fp`` (a

    ``.write()``-supporting file-like object).

     我理解为两个动作,一个动作是将”obj“转换为JSON格式的字符串,还有一个动作是将字符串写入到文件中,也就是说文件描述符fp是必须要的参数 """

 

示例代码:

 

>>> import json

>>> json.dumps([])    # dumps可以格式化所有的基本数据类型为字符串

'[]'

>>> json.dumps(1)    # 数字

'1'

>>> json.dumps('1')   # 字符串

'"1"'

>>> dict = {"name":"Tom", "age":23} 

>>> json.dumps(dict)     # 字典

'{"name": "Tom", "age": 23}'

 

a = {"name":"Tom", "age":23}

with open("test.json", "w", encoding='utf-8') as f:

    # indent 超级好用,格式化保存字典,默认为None,小于0为零个空格

    f.write(json.dumps(a, indent=4))

    # json.dump(a,f,indent=4)   # 和上面的效果一样

保存的文件效果:

https://i-blog.csdnimg.cn/blog_migrate/e0fdd23cddda804faa8cc4d2bcaf38d6.png

 

. loads load 

loadsload  反序列化方法

       loads 只完成了反序列化,

       load 只接收文件描述符,完成了读取文件和反序列化

 

 查看源码:

def loads(s, encoding=None, cls=None, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, object_pairs_hook=None, **kw):

    """Deserialize ``s`` (a ``str`` instance containing a JSON document) to a Python object.

       将包含str类型的JSON文档反序列化为一个python对象"""

def load(fp, cls=None, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, object_pairs_hook=None, **kw):

    """Deserialize ``fp`` (a ``.read()``-supporting file-like object containing a JSON document) to a Python object.

        将一个包含JSON格式数据的可读文件饭序列化为一个python对象"""

 

实例:

>>> json.loads('{"name":"Tom", "age":23}')

{'age': 23, 'name': 'Tom'}

 

import json

with open("test.json", "r", encoding='utf-8') as f:

    aa = json.loads(f.read())

    f.seek(0)

    bb = json.load(f)    # 与 json.loads(f.read())

print(aa)

print(bb)

 

# 输出:

{'name': 'Tom', 'age': 23}

{'name': 'Tom', 'age': 23}

 

. json picle 模块

 json模块和picle模块都有  dumpsdumploadsload四种方法,而且用法一样。

不用的是json模块序列化出来的是通用格式,其它编程语言都认识,就是普通的字符串,

picle模块序列化出来的只有python可以认识,其他编程语言不认识的,表现为乱码

不过picle可以序列化函数,但是其他文件想用该函数,在该文件中需要有该文件的定义(定义和参数必须相同,内容可以不同)

. python对象(obj json对象的对应关系

    +-------------------+---------------+

    | Python            | JSON          |

    +===================+===============+

    | dict              | object        |

    +-------------------+---------------+

    | list, tuple       | array         |

    +-------------------+---------------+

    | str               | string        |

    +-------------------+---------------+

    | int, float        | number        |

    +-------------------+---------------+

    | True              | true          |

    +-------------------+---------------+

    | False             | false         |

    +-------------------+---------------+

    | None              | null          |

    +-------------------+---------------+

 

 

 . 总结

 1. json序列化方法:

          dumps:无文件操作            dump:序列化+写入文件

  2. json反序列化方法:

          loads:无文件操作              load 读文件+反序列化

  3. json模块序列化的数据 更通用

      picle模块序列化的数据 python可用,但功能强大,可以序列号函数

  4. json模块可以序列化和反序列化的  数据类型  python对象(obj json对象的对应关系表

 

### 转换流程概述 为了将Labelme生成的JSON文件转换为YOLO格式的TXT文件,需要完成以下几个核心操作: 1. **解析JSON文件**:提取标注的目标类别、边界框的位置信息以及图像的高度和宽度。 2. **计算YOLO格式参数**:根据YOLO的要求,将边界框的左上角和右下角坐标转换为中心点坐标,并按比例缩放到范围 `[0, 1]`。 3. **保存到TXT文件**:按照每行一条目标记录的形式存储,每一行的数据格式为 `class_id center_x center_y width height`。 以下是具体实现方法及相关代码示例[^1]。 --- ### 实现代码 #### 解析JSON转换为YOLO格式 以下是一个完整的Python脚本用于执行该任务: ```python import os import json def convert_labelme_json_to_txt(json_file, output_dir): """ 将LabelmeJSON文件转换为YOLO格式的TXT文件。 :param json_file: 输入的Labelme JSON文件路径 :param output_dir: 输出的YOLO TXT文件目录 """ with open(json_file, 'r', encoding='utf-8') as f: data = json.load(f) image_width = data['imageWidth'] image_height = data['imageHeight'] txt_content = [] for shape in data['shapes']: label = shape['label'] # 获取目标类别名称 points = shape['points'] # 获取矩形顶点坐标 [[x1, y1], [x2, y2]] # 提取矩形的两个顶点 (xmin, ymin), (xmax, ymax) xmin, ymin = min(points[0][0], points[1][0]), min(points[0][1], points[1][1]) xmax, ymax = max(points[0][0], points[1][0]), max(points[0][1], points[1][1]) # 计算中心点坐标及宽高 center_x = ((xmin + xmax) / 2) / image_width center_y = ((ymin + ymax) / 2) / image_height bbox_width = abs(xmax - xmin) / image_width bbox_height = abs(ymax - ymin) / image_height class_id = get_class_id(label) # 根据类别名获取对应的ID txt_line = f"{class_id} {center_x:.6f} {center_y:.6f} {bbox_width:.6f} {bbox_height:.6f}" txt_content.append(txt_line) # 构造输出文件路径 base_name = os.path.splitext(os.path.basename(json_file))[0] output_file = os.path.join(output_dir, f"{base_name}.txt") # 写入TXT文件 with open(output_file, 'w', encoding='utf-8') as f: f.write("\n".join(txt_content)) def get_class_id(class_name): """ 根据类别名称返回其对应ID。 需要提前定义好类别的映射关系。 """ class_map = {"TT": 0, "car": 1} # 自定义类别映射表 return class_map.get(class_name, -1) if __name__ == "__main__": input_json = "path/to/input.json" # 替换为实际输入JSON文件路径 output_directory = "path/to/output/txt/" # 替换为实际输出TXT文件夹路径 if not os.path.exists(output_directory): os.makedirs(output_directory) convert_labelme_json_to_txt(input_json, output_directory) ``` --- ### 关键点解释 1. **JSON结构分析** Labelme生成的JSON文件中包含了多个字段,其中最重要的部分是 `"shapes"` 列表。每个列表项描述了一个标注对象的信息,包括类别 (`label`) 和边界框的顶点坐标 (`points`)。通过这些信息可以进一步推导出YOLO所需的标准格式[^5]。 2. **YOLO格式要求** YOLO格式规定了每条记录由五个数值组成:`class_id`, `center_x`, `center_y`, `width`, `height`。前三个表示目标区域的中心位置(相对整张图片的比例),后两者则分别代表目标区域的宽度和高度(同样基于整个图片大小标准化)。所有值都应位于区间 `[0, 1]` 中[^2]。 3. **异常处理** 如果某些JSON文件存在错误或不完整的情况,则可能引发程序崩溃。因此建议加入适当的异常捕获机制来增强健壮性[^4]。 --- ### 示例输出 假设有一个名为 `example.json` 的文件内容如下: ```json { "shapes": [ { "label": "car", "points": [[100, 100], [200, 200]], "shape_type": "rectangle" } ], "imageWidth": 640, "imageHeight": 480 } ``` 运行上述脚本后会生成一个同名 `.txt` 文件,其内容可能是这样的: ``` 1 0.250000 0.375000 0.156250 0.208333 ``` 这表明在原图中有这样一个汽车物体,它占据了一定的空间比例[^3]。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值