用PVN3D训练自制LINEMOD数据集过程记录

原创已于 2023-12-12 22:41:31 修改 · 置顶 · 4.5k 阅读

·

5

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#3d #深度学习 #python

于 2022-02-23 18:53:29 首次发布

6DoF 同时被 2 个专栏收录

11 篇文章

订阅专栏

6自由度位姿估计

10 篇文章

订阅专栏

本文介绍了如何制作自己的LINEMOD数据集，解决内存溢出问题，并指导如何将PVN3D模型调整以适应新的数据集。包括数据合并、参数修改、训练与测试结果分析。适合对位姿估计感兴趣的开发者加入讨论。

对6D位姿估计感兴趣的小伙伴可以加我，拉到位姿估计交流群

1.制作自己的LINEMOD数据集

（1）制作过程与步骤

制作数据集的过程参考：6d位姿估计—制作自己的LINEMOD数据集过程记录(有效的方法)

(2)合并数据集、生成test.txt与train.txt

数据制作过程中在获取帧变换（python compute_gt_poses.py LINEMOD/duck2
）步骤中，若录制的图片过多的话，内存会溢出，因此不建议一次性录制太多图片，本人在record2.py中，RECORD_LENGTH=50，每次录制大概能够生成一千零几张图片。

基于以上原因，我们需要录制多个数据集，并在后期需要将rgb、depth、mask图像以及gt.yml、info.yml进行合并，并生成train.txt和test.txt。合并程序的电脑不能联网，有需要的可以私信我。

2.将PVN3D的输入替换为自己的数据集

（1）将datasets/linemod/Linemod_preprocessed/data/09改为009，将自己的merge文件夹改为09；

（2）将JPEGImages改为rgb；

（3）在common.py中修改相机内参；并将第37行的mini_batch_size=32

（4）将./pnv3d/datasets/linemod/linvmod_dataset.py中的第188中的png改为jpg，是因为我的rgb图未jpg格式。而程序默认的格式的png。

注：因为在生成info.yml的时候depth_scale用的是0.001

3.训练

训练集大概有12000多张图片

cd pvn3d
python3 -m train.train_linemod_pvn3d --cls duck

4训练结果

（1）使用与训练集一同录制的数据集分割出来的测试效果

在这里插入图片描述
由图可以看出，基本是正确的。

（2）使用与训练集同一场景下录制的数据集进行测试

在这里插入图片描述
由图可以看出来，小了一号，是整个数据集进行测试结果都小一号，不知道为什么。

（3）使用不同场景下录制的数据集进行测试

在这里插入图片描述

对位姿估计感兴趣的小伙伴可以加群

评论 7

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。