ObjectDatasetTools生成linemod数据集预处理Linemod_preprocessed过程记录

最新推荐文章于 2024-05-14 11:06:03 发布

-俊后生-

最新推荐文章于 2024-05-14 11:06:03 发布

阅读量1.4k

点赞数 10

文章标签： python 开发语言

本文链接：https://blog.youkuaiyun.com/qq_41977396/article/details/135569808

版权

此前用ObjectDatasetTools制作的真实数据，需进一步处理才能用于算法训练。介绍了在LINEMOD/Gold文件夹下依次运行多个Python脚本进行预处理的步骤，包括生成特定文件、转换图片格式、替换相机参数、划分测试集和训练集等，最终形成所需文件目录结构。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在之前用ObjectDatasetTools制作真实数据后，还需要进一步处理才能用于算法训练。

主要包括以下预处理步骤：
在LINEMOD/Gold⽂件夹下依次创建如下python脚本并运行

gt_info.py

import os
import numpy as np
import matplotlib.image


f = open("gt.txt", "w")

count = len(os.listdir("./transforms"))
for k in range(count):
    print('正在读取第'+str(k)+"张\n")
    data_load = np.load("transforms" + "/" + str(k) + ".npy")
    cam_r = []
    for i in range(3):
        for j in range(3):
            cam_r.append(data_load[i][j])      #cam_R_m2c

    cam_t = [data_load[0][3] * 1000,data_load[1][3] * 1000,data_load[2][3] * 1000]   #cam_t_m2c

    im = matplotlib.image.imread('mask/' + str(k) +'.png')
    r = []
    c = []
    ls1 = [0]
    ls2 = [0]

    for i in range(480):
        for j in range(1, 640):
            if im[i][j - 1] == 0 and im[i][j] == 1:
                r.append(i)
                c.append(j)
                break
    for i in range(480):
        for j in range(1, 640):
            if im[i][j - 1] == 1 and im[i][j] == 0:
                ls1[0] = i
                ls2[0] = j
    r.append(ls1[0])
    c.append(ls2[0])
    rmin = min(r)
    rmax = max(r)
    cmin = min(c)
    cmax = max(c)
    r.clear()
    c.clear()
    bb=[]
    bb.append(rmin)
    bb.append(rmax)
    bb.append(cmin)
    bb.append(cmax)
    print(cam_t)
    print(cam_r)
    print(bb)
    f.write("{}:\n".format(k))
    f.write("- cam_R_m2c: [{}, {}, {}, {}, {}, {}, {}, {}, {}]\n".format(cam_r[0],cam_r[1],cam_r[2],cam_r[3],cam_r[4],cam_r[5],cam_r[6],cam_r[7],cam_r[8]))
    f.write("  cam_t_m2c: [{}, {}, {}]\n".format(cam_t[0],cam_t[1],cam_t[2]))
    f.write("  obj_bb: [{}, {}, {}, {}]\n".format(bb[0],bb[1],bb[2],bb[3]))
    f.write("  obj_id: 1\n")
    cam_r.clear()
    bb.clear()
    cam_t.clear()
f.close()

os.rename("./gt.txt","./gt.yml")

运行后得到gt.yml文件

rename.py

import os
import cv2


root_rgb = "./JPEGImages/"
root_mask = "./mask/"
root_depth = "./depth/"

ls_rgb = os.listdir(root_rgb)
ls_mask = os.listdir(root_mask)
ls_depth = os.listdir(root_depth)

os.mkdir("rgb")

for file in ls_rgb:
    os.rename(root_rgb + file,"./rgb/" +"0" * int(4 - len(file[:-4])) + file[:-4] + ".jpg")
for fil

最低0.47元/天解锁文章