PointNet阅读笔记
本文开创性地提出了将深度学习直接用于三维点云数据上的方法。三维点云由于其无序性,无法直接使用卷积等操作。本文提出了对称函数解决点的无序性问题,并给出了理论证明。设计了能够进行分类和分割任务的网络结构,认为提取出的特征点是三维物体的骨架结构。
问题说明
输入一个无序点集,包含n个点,每个点是其坐标表示(x,y,z),也可以添加其他手动提取的特征。对于分类问题,输出1*k的向量,表示k个类别的得分。对于分割问题,输出n * m的得分矩阵,表示每个点(或每个子区域)的类别标签。
文章使用的主要方法可以概括如下:
f是全局特征的提取函数,h是每一个点的特征提取函数,g是文章提出的对称函数。在数据量很大的情况下,对一系列点通过f提取特征,可以与对单个点提取特征的点集,与对称函数的作用结果相近似。文章证明了这一理论。
而单个点的特征提取函数,本文选用了mlp。权值共享的mlp作用于每一个输入特征点,进行单点的特征提取操作,在最后使用max pooling进行全局特征的统一。实现中,使用