Graph Attention Convolution for Point Cloud Semantic Segmentation--CVPR2019--论文笔记

论文题目-《基于图注意力卷积的点云语意分割》
引言
在本文中,作者提出了一个新的图注意力卷积模型用于点云语意的分割。
如下图是标准卷积和GAC的区别
在这里插入图片描述
左图是标准卷积,其中每个节点的权重仅仅由邻居节点的空间位置决定,所以在学习特征的时候就很难去加以区分不同类别的邻居节点的属性。
右图是GAC,在GAC中由于注意力权重可以区分不同类别的属性,这样的话,我们就能够更加有目的性的去学习更加匹配的特征,就像图中一样在学习桌子特征的时候,我们就可以有意的让椅子的权重变小一些,就能学到更好的特征。
贡献:
1.提出了一个新的图注意力卷积用以学习一个动态的适应对象结构的卷积核。
2.提供了有关图注意力卷积的详细理论和经验分析。
3.训练了一个端到端的图注意力卷积网络用于点云语意分割,而且取得了很好地效果。

2.方法
提出了一个新的图注意力卷积GAC对于3D点云,构建了一个端到端的点云分割框架。

2.1图注意力卷积
图卷积分为2种,一种是基于谱域的图卷积,是运用傅里叶变换,和拉普拉斯矩阵,定义的图卷积。第二种是基于空间域的图卷积,这种图卷积就是人为的定义卷积核,然后在节点的邻居范围内进行卷积。本文用的就是第二种,直接针对节点的邻居节点进行图卷积操作,然后又在图卷积操作之中加入了注意力机制。即为GAC。
本文中:
给定一个点云集
在这里插入图片描述
其中的p1,pn,就是坐标集。3维坐标。
在这里插入图片描述
代表邻居节点。
在这里插入图片描述
代表输入的特征,每一个特征有F维。
GAC的目的是去学习一个函数在这里插入图片描述
将输入的特征变成一个新的维度的特征。
然后作者构建了一个分享的注意力机制
在这里插入图片描述
能够结合节点的坐标位置和节点的特征,以便能够动态的适应这个对象的结构。
每一个节点的注意力权重的计算如下:
在这里插入图片描述
其中
在这里插入图片描述
代表这个节点i和到节点j之间的注意力权重向量。∆pij = pj −pi,就是对应坐标相减。
∆hij = Mg(hj )−Mg(hi),就是对应特征的差值,其中,M代表一个多层感知机,把特征从F维变为K维。α 代表邻居节点之间的空间关系。最后,在本文中分享注意力机制被实现通过公式:
在这里插入图片描述
其中||是连接符号M是多层感知机。如图:
在这里插入图片描述
左边的就是针对点1得到的注意力权重向量,右边就是连接操作,通过计算坐标差和特征差,然后连接最后通过分享注意力机制,就是2个向连接,最后进行标准化,得到aij,k
标准化公式如下:
在这里插入图片描述
其中
aij,k就是节点i的第j个节点之间的第K个通道上的注意力权重向量。

所以,最后GAC输出的特征可以用以下公式表达:
在这里插入图片描述
表示节点i的所有邻居节点的特征与权值向量的乘积。b是一个偏执向量。

,2.2图注意力网络
如图:
在这里插入图片描述
如上图的网络类似与金字塔,其中GAC用于特征的学习,然后使用图池操作降低每个要素通道中点云的分辨率。最后学习到的特征再被一层一层的还原回原来的维度。最后得到一个尺度和输入一样的特征图。然后通过大量的数据集就可以学习到点特征的标签,最后整个训练好的网络,就可以用以预测点云数据集,每个点的标签了。
图池化:图池化意在粗化图上输出聚合之后的特征。粗化图就会前面的精炼层,一层一层的,和下采样一样。公式表达如下:
在这里插入图片描述
表示聚合邻居节点的特征。
特征插补:就是后面的反向金字塔结构,为了让最终得到的节点的数量和输入节点的数量相同,需要对特征进行插补。具体的插补方法是,在每一层,搜索节点的3个最近邻,然后计算他们的特征加权和,然后下一层插补的节点的值就共享这个特征。一层一层的插补,直到最后一层和输入的规模一样。
2.3 点云上的图金字塔结构的构造
本节介绍如何在点云上构造图金字塔。 具体来说,我们搜索空间所有点的邻居,并将它们链接为图。 通过交替应用图构造和粗化技术来构造具有不同空间比例的图金字塔结构。
点云上的图构造:对于给定的点云集合,规定每个点代表一个节点,节点的邻居就被添加边。确定邻居节点的方法是,对于一个节点在以值为半径的圆中随机选取一定数量的节点为邻居节点。
图粗话:图粗话类似于下采样,就是精炼特征。因为点云点很多,不可能全部卷积,就需要采样,通过最远点采样的方法,采取规定点的数量,然后用之前图构造的方法,取每个点一定半径之内的邻居节点,通过聚合函数,聚合范围内邻居节点的特征。就这样一层一层的精炼特征。
4.实验
在这里插入图片描述
在这里插入图片描述

### HRNet语义分割相关论文及其下载方式 HRNet(High-Resolution Network)是一种专注于保留高分辨率表示的深度学习架构,广泛应用于语义分割领域。以下是关于HRNet语义分割的一些重要研究工作以及如何获取这些论文的方法。 #### 关于HRNet的核心概念 HRNet的设计理念在于在整个网络中持续保持高分辨率特征图的学习过程[^1]。这种设计使得HRNet在处理复杂的视觉任务时表现出色,尤其是在语义分割方面。它通过并行连接多个不同分辨率的分支来融合多尺度信息,从而显著提高了模型的表达能力和准确性。 #### 主要推荐的HRNet语义分割论文 以下是一些与HRNet语义分割密切相关的经典论文: 1. **《Deep High-Resolution Representation Learning for Visual Recognition》** - 这篇论文首次提出了HRNet的概念,并详细描述了其在网络结构设计上的创新之处。该论文强调了在训练过程中维持高分辨率特征的重要性,并展示了HRNet在多种计算机视觉任务中的优越性能。 - 获取方式:可以通过访问IEEE Xplore数据库或者arXiv网站直接搜索标题下载PDF文件。 2. **《HRNetv2: Re-thinking Spatial As Context in Scene Parsing》** - 此版本进一步改进了原始HRNet框架,增强了空间上下文建模的能力。作者引入了更高效的模块化组件以适应更大规模的数据集和更高难度的任务需求。 - 获取方式:同样支持从官方开源存储库或学术搜索引擎如Google Scholar检索到完整的文档。 3. **《Hybrid Urban Scene Segmentation via Multi-Scale Fusion of Hierarchical CNN and Graph Embedding》** - 虽然这篇不是专门讨论HRNet本身,但它成功地将HRNet与其他先进技术相结合用于特定应用场景——即城市环境下的场景理解。文中提到的方法利用多尺度融合策略提升了最终效果[^2]。 - 获取途径:通常可在SpringerLink或其他付费期刊平台找到正式出版版;部分情况下也可能存在免费预印本形式可供查阅。 4. **《RegSeg: Rethink Dilated Convolution for Real-Time Semantic Segmentation》** - 尽管此文章重点探讨的是另一种实时语义分隔方案RegSeg,但其中某些设计理念可以作为对比参考帮助深入理解HRNet的优势所在。特别是有关膨胀卷积重新思考的部分对于优化现有系统具有启发意义[^3]。 - 下载地址:一般可通过出版社主页或是开放存取资源定位具体位置。 #### 如何有效寻找所需资料? 如果上述列举未能完全满足实际需求,则建议采取如下措施继续挖掘潜在目标文献: - 利用专业索引工具比如PubMed Central (PMC), DOAJ, CORE等; - 加入相关主题论坛交流群组分享心得经验互相协助解决问题; - 定期关注顶级会议(CVPR/ECCV/ICCV/NIPS)最新动态及时捕捉前沿趋势变化情况。 ```python import requests from bs4 import BeautifulSoup def fetch_paper(url): response = requests.get(url) soup = BeautifulSoup(response.content, 'html.parser') pdf_link = None # Example logic to extract PDF link from a webpage links = soup.find_all('a', href=True) for link in links: if '.pdf' in link['href']: pdf_link = link['href'] break return pdf_link # Usage example with hypothetical URL paper_url = "https://example.com/hrnet-paper" download_link = fetch_paper(paper_url) if download_link is not None: print(f"Download the paper here: {download_link}") else: print("No direct PDF link found.") ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值