基于2D模型知识迁移的高效3D学习方法
1. 训练设置
1.1 训练参数
对于不同的任务,训练参数设置如下:
- 部件分割 :训练网络600个周期,批量大小为32,学习率为0.025,权重衰减为0.0001。
- 场景语义分割 :训练模型500个周期,批量大小为4,学习率为0.05。
- 分类模型 :训练300个周期,批量大小为32,学习率为0.05。
两个任务都采用动量为0.9的SGD优化器,并使用幂为0.9的多项式调度器。模型在多个NVIDIA Tesla V100 - SXM2 GPU上进行训练。O - CNN在对象分类、形状部件分割和场景语义分割中分别采用32³、64³和512³分辨率的叶八叉树。点预测在部件分割中采用线性插值,在场景语义分割中采用最近邻插值。
1.2 数据增强
对输入点云应用以下数据增强方法:
- 随机旋转
- 随机缩放
- 随机弹性变形
- 随机颜色对比度调整
- 随机颜色抖动
2. 数据高效的场景语义分割
2.1 数据集与场景
使用ScanNetV2数据集,它由707个不同空间的3D点云室内场景和对应的语义注释组成,涵盖20个语义类别。遵循官方的数据稀缺场景:
- 有限注释(LA) :每个场景仅考虑少数标记点。
- 有限重建(LR) :考虑少数标记场景
2D知识迁移提升3D学习效果
超级会员免费看
订阅专栏 解锁全文
600

被折叠的 条评论
为什么被折叠?



