【点云系列】FoldingNet:Point Cloud Auto encoder via Deep Grid Deformation

FoldingNet是一种基于2D纸折叠思想的3D点云自动编码器,通过深度网格变形重建3D物体。它利用PointNet作为编码器,结合2D网格的解码器来学习点云的表示。实验结果显示,FoldingNet能够有效地进行形状插值和重建。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


清库存系列

1. 概要

题目:FoldingNet: Point Cloud Auto encoder via Deep Grid Deformation (CVPR’18 spotlight)
论文:https://openaccess.thecvf.com/content_cvpr_2018/papers/Yang_FoldingNet_Point_Cloud_CVPR_2018_paper.pdf
补充材料:https://openaccess.thecvf.com/content_cvpr_2018/Supplemental/1129-supp.pdf
代码:https://www.merl.com/research/license#FoldingNet
简述: 基于2D纸折叠的思想产生3D物体

后续延伸:

  1. FoldingNet++
  2. Real-time Soft Robot 3D Proprioception via Deep Vision based Sensing

类似工作:
AtlasNet, 其是使用multiple grid块来初始化2D grid。

2. 动机

神经网络能否学习纸的折叠呢?
3D点云数据大部分来源于物体表面小区域可以看成是2D流体,可以通过2D经过一系列变换获取得到。
在这里插入图片描述

3. 思想

整体框架:主设计解码器

主要是设计了解码器,Encoder直接使用PointNet部分和简单图思想。

在这里插入图片描述
简单来讲,就是把隐码复制了N份,然后与2D的网格进行拼接,形成Nx(D+K)维度的隐码,通过学习获得有位置信息的点云。

其实可以简单理解成为几何当中的一个定义:自然界里的高维数据可以表示为低维非线性的流形。这里就运用这个思想将三维点云认为是二维的流形,那么二维里面就用一个简单的网格来模拟。所以其受限在只可以模拟3D中没有环出现的情况,有环的出现时就不行了。所以才有了后面FoldingNet++的出现用来解决有环出现的情况。
在这里插入图片描述

基于图的编码器Encoder

在这里插入图片描述

编码器 = 多层感知器 + 基于图的最大池化层,两者拼接在一起形成编码器;

图的构成:16-KNN, 对于每个点,计算器的局部协方差矩阵,使用 3 × 3 3\times3

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值