文章目录
1. 介绍pointnet++
pointnet++是在pointnet的基础上提出的,它用于解决pointnet在场景分割时直接将所有的点最大池化成一个全局特征导致分割效果不好的问题。
pointnet++采用了分层点云采样的方法,把每一层的操作叫做一次set abstration,包括采样、分组和特征提取,首先通过最远采样点法(FPS)在点云上采样一些点,然后以这些点为中心在某一范围内寻找k个临近点组成局部子点云,接着对子点云使用pointnet作特征提取和池化操作,继续下一个set abstration。随着层数的增加,中心点的个数越来越少。这个过程类似于聚类操作。
进行分组的时候,需要选取策略,因为数据分布的密度不同,可能导致分组很不合理。
- 多尺度分组。依据多个尺度,譬如欧氏距离,曼哈顿距离等结合来进行分组,但是这样的分组会导致计算成本很高;
- 多分辨率分组。只利用两个尺度,一个是上一次set abstration得到的特征,另一个是根据当前数据获得的特征,联合这两个特征进行分组。
2. 请你说说Attention Model
注意力机制可以选择性地将注意力集中在较为显著的区域,以更好捕捉时空语义信息。
注意力机制主要用在自然语言处理、图像修复、超分辨率、风格迁移等,常用的策略包括空间注意力,通道注意力等。
空间注意力主要关注两个不同位置的特征信息,寻找两个位置特征之间在时间空间上的依赖关系,用在视频动作识别;
通道注意力增强有用通道的响应,削弱影响较小的通道响应,一般将通道融合和注意力机制结合。一般用于图像处理。
3. k-means簇心随机确定不好,有没有什么办法?
- one: 随机选取初始簇心,然后进行多次聚类,将每次聚类的SSE(误差平方和)作比较,选择最小的那个。但是这个方法还是随机确定的,而且增加了计算的复杂度;
- two:先利用其他聚类技术进行聚类