Labelme 批量转 dataset
实验环境
操作系统:Windows 10
Python:3.8
Labelme:4.5.13 (这个版本比较重要,不同版本代码可能会不一样)
Anaconda:4.10.1
如果还有同学没有安装好 Anaconda,或者 Labelme 请参见,我的另外两篇文章:安装Anaconda,安装 Labelme
0.概述
现有的标注 json 文件转 dataset 的工具只能转单个 json 文件,没有办法批量转多个标注文件。本文中笔者根据转换原理修改相关代码实现了批量转换一个目录下所有 json 文件的方法,该方法支持输入一个目录,并且兼容 -o, --out 参数来指定输出 dataset 的目录,详细介绍如下。
1.原理
默认安装的 Labelme 有个可以单个转换 json 标注文件成 dataset 的工具,在 $python目录\Scripts 下,例如:
Anaconda虚拟环境 :
D:\anaconda3\envs\labelme\Scripts\labelme_json_to_dataset.exe
非虚拟环境:
E:\python\Python37\Scripts\labelme_json_to_dataset.exe
这个exe文件,调用的代码是 $python目录\Lib\site-packages\labelme\cli\json_to_dataset.py ,例如
Anaconda虚拟环境:
D:\anaconda3\envs\labelme\Lib\site-packages\labelme\cli\json_to_dataset.py
非虚拟环境:
E:\python\Python37\Lib\site-packages\labelme\cli\json_to_dataset.py
执行命令
(labelme) PS D:\anaconda3\envs\labelme\Scripts> .\labelme_json_to_dataset.exe E:\annotation\xx.json --out E:\xxx
1. 参数1:标注文件 xx.json
2. 参数2: --out 输出目录
但是这个只能转单个文件,因此就要修改json_to_dataset.py代码,从转一个文件改成修改多个文件
2.代码
我的这个代码是在Labelme 4.5.13 下修改的,如果同学是这个版本,可以直接使用。如果不是,可以详细看下中文注释,请切记在你自己的文件上修改,要不会出现各种奇怪的问题。
主要思路是在读取完第一个参数后,把参数当成一个目录,读取里面的所有文件,然后循环转换,核心代码如下:
filelist = os.listdir(json_file) # 输入的参数当成目录,取得目录下的所有 json 文件
for i in range(0, len(filelist)): # 遍历文件列表
path = os.path.join(json_file, filelist[i]) # 单个文件路径
if os.path.isdir(path): # 如果是目录则读取下一个
continue
my_out = osp.basename(filelist[i]).replace(".", "_") # 文件名转目录
if args.out is None:
# out_dir = osp.basename(json_file).replace(".", "_") # 注释掉
out_dir = osp.join(osp.dirname(json_file), my_out) # 总目录 + 文件目录
else:
# out_dir = args.out # 注释掉
if not osp.exists(args.out): # 兼容目录不存在情况
os.makedirs(args.out)
out_dir = osp.join(args.out, my_out) # 兼容out参数 -- 总目录 + 文件目录
if not osp.exists(out_dir):
os.mkdir

最低0.47元/天 解锁文章
1336

被折叠的 条评论
为什么被折叠?



