Labelme 批量转 dataset 使用 labelme_json_to_dataset 命令（简明图文教程）

最新推荐文章于 2025-09-15 14:48:42 发布

原创

最新推荐文章于 2025-09-15 14:48:42 发布 · 1.9w 阅读

129 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #人工智能 #Labelme #数据标注 #数据集

Labelme 批量转 dataset

0.概述
1.原理
2.代码
3.试验过程
- 3.1 实验一：输入单个目录
- 3.2 实验二：增加参数 --out 输出文件目录
4.方法二

实验环境

操作系统：Windows 10
Python：3.8
Labelme：4.5.13 (这个版本比较重要，不同版本代码可能会不一样）
Anaconda：4.10.1

如果还有同学没有安装好 Anaconda，或者 Labelme 请参见，我的另外两篇文章：安装Anaconda，安装 Labelme

0.概述

现有的标注 json 文件转 dataset 的工具只能转单个 json 文件，没有办法批量转多个标注文件。本文中笔者根据转换原理修改相关代码实现了批量转换一个目录下所有 json 文件的方法，该方法支持输入一个目录，并且兼容 -o, --out 参数来指定输出 dataset 的目录，详细介绍如下。

1.原理

默认安装的 Labelme 有个可以单个转换 json 标注文件成 dataset 的工具，在 $python目录\Scripts 下，例如：

Anaconda虚拟环境 ：
D:\anaconda3\envs\labelme\Scripts\labelme_json_to_dataset.exe
非虚拟环境：
E:\python\Python37\Scripts\labelme_json_to_dataset.exe

这个exe文件，调用的代码是 $python目录\Lib\site-packages\labelme\cli\json_to_dataset.py ，例如

Anaconda虚拟环境：
D:\anaconda3\envs\labelme\Lib\site-packages\labelme\cli\json_to_dataset.py
非虚拟环境：
E:\python\Python37\Lib\site-packages\labelme\cli\json_to_dataset.py

执行命令

(labelme) PS D:\anaconda3\envs\labelme\Scripts> .\labelme_json_to_dataset.exe E:\annotation\xx.json --out E:\xxx

1. 参数1：标注文件 xx.json
2. 参数2： --out 输出目录

但是这个只能转单个文件，因此就要修改json_to_dataset.py代码，从转一个文件改成修改多个文件

2.代码

我的这个代码是在Labelme 4.5.13 下修改的，如果同学是这个版本，可以直接使用。如果不是，可以详细看下中文注释，请切记在你自己的文件上修改，要不会出现各种奇怪的问题。
主要思路是在读取完第一个参数后，把参数当成一个目录，读取里面的所有文件，然后循环转换，核心代码如下：

filelist = os.listdir(json_file)  # 输入的参数当成目录，取得目录下的所有 json 文件
for i in range(0, len(filelist)):  # 遍历文件列表
    path = os.path.join(json_file, filelist[i])  # 单个文件路径
    if os.path.isdir(path):  # 如果是目录则读取下一个
        continue
    my_out = osp.basename(filelist[i]).replace(".", "_")  # 文件名转目录
    if args.out is None:
        # out_dir = osp.basename(json_file).replace(".", "_")  # 注释掉
        out_dir = osp.join(osp.dirname(json_file), my_out)   # 总目录 + 文件目录
    else:
        # out_dir = args.out # 注释掉
        if not osp.exists(args.out): # 兼容目录不存在情况
            os.makedirs(args.out)
        out_dir = osp.join(args.out, my_out)  # 兼容out参数  --  总目录 + 文件目录
    if not osp.exists(out_dir):
        os.mkdir

最低0.47元/天解锁文章

22 条评论

ethanwinters777 2025.03.23
熬了一晚上到现在，每一步都小心翼翼的，爱你大佬，终于成功了

wqoooooo 2024.03.17
[face]emoji:054.png[/face]太牛了佬一晚上困惑的问题终于搞出来了

WYXJY 2023.11.22
博主np，使用bat方法解决了，太感谢了

pcycccccc 2023.10.17
博主nb，试了最后的那个bat办法解决了困扰我几个小时的问题！

vazheaven 2022.11.04
博主太牛了

你叫什么昵称 2022.10.16
win11环境可以吗

aabbcc__1 2022.05.10
感谢感谢，用labelme2voc.py报错了大半天用这个终于搞定了

aliez. 2022.05.10
大佬，你太牛了，我爱你，弄了两天了终于好了[face]emoji:054.png[/face]

aliez. 2022.05.10
大佬，总是报错 WARNING] json_to_dataset:main:15 - This script is aimed to demonstrate how to convert the JSON file to a single image dataset. [WARNING] json_to_dataset:main:19 - It won't handle multiple JSON files to generate a real-use dataset. Traceback (most recent call last): File "D:\Users\i\anaconda3\lib\runpy.py", line 197, in _run_module_as_main return _run_code(code, main_globals, None, File "D:\Users\i\anaconda3\lib\runpy.py", line 87, in _run_code exec(code, run_globals) File "D:\Users\i\anaconda3\Scripts\labelme_json_to_dataset.exe\__main__.py", line 7, in <module> File "D:\Users\i\anaconda3\lib\site-packages\labelme\cli\json_to_dataset.py", line 70, in main lbl_viz = imgviz.label2rgb( TypeError: label2rgb() got an unexpected keyword argument 'img'
- 小陈搞电子回复aliez. 2023.11.23
  解决了吗

pipi1231rs 2022.04.20
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte
- happery回复璀璨星宸 2025.02.21
  读取到非json格式了
- happery回复Allonsqy 2025.02.21
  读取到非json文件了
- 璀璨星宸回复pipi1231rs 2023.01.16
  我也是这个报错，请问解决了吗
- Allonsqy回复pipi1231rs 2022.04.21
  我也是这个问题，请问您解决了吗