
论文阅读
文章平均质量分 75
笔记
幽殇默
他时若遂凌云志,敢笑黄巢不丈夫。
展开
-
BrepMFR
特征识别(FR)是集成计算机辅助设计(CAD)、计算机辅助工艺规划(CAPP)和计算机辅助制造(CAM)系统的关键技术,在现代数字化制造中起着至关重要的作用。近年来,深度学习方法的出现为识别具有复杂几何形状的高度相交特征提供了一种新的方法。然而,由于标记真实CAD模型的成本很高,神经网络通常是在计算机合成的数据集上训练的,当应用于现实世界的CAD模型时,会导致明显的性能下降。因此,我们提出了一种新的深度学习网络,BrepMFR,设计用于从边界表示(B-rep)模型中识别加工特征(MFR)。原创 2024-07-16 16:22:14 · 1158 阅读 · 0 评论 -
BRepGAT Graph neural network to segment machining feature faces in a B-rep model【阅读笔记】
笔记原创 2024-05-12 21:19:59 · 1204 阅读 · 0 评论 -
MVCNN++ CAD Model Shape Classification using Multi-View Convolutional Neural Networks【浅读】
深度神经网络在图像和文本数据的分类和检索任务中显示出有希望的成功。虽然在计算机图形学领域已经有了几种深度网络的实现,但这些算法不容易在不同的数据集之间转换,特别是对于产品设计和制造领域中使用的形状。与计算机图形学领域中用于三维形状分类和检索的数据集不同,三维模型的工程级描述并不产生整齐的不同类别。目前的研究着眼于3D形状深度学习算法的分类和检索的改进形式,通过使用诸如放松分类,使用定角相机角度捕捉特征细节和迁移学习来减少训练形状识别算法所需的数据量和处理时间。原创 2024-04-23 23:11:25 · 698 阅读 · 0 评论 -
Bag of Tricks for Image Classification with Convolutional Neural Networks【浅读】
最近在图像分类研究中取得的许多进展可以归功于训练过程的改进,例如数据增强和优化方法的变化。然而,在文献中,大多数改进要么作为实现细节简要地提到,要么只在源代码中可见。在本文中,我们将研究这些改进的集合,并通过烧蚀研究经验评估它们对最终模型精度的影响。我们将证明,通过将这些改进结合在一起,我们能够显著改进各种CNN模型。例如,我们将ResNet-50在ImageNet上的前1验证准确率从75.3%提高到79.29%。原创 2024-04-23 23:10:13 · 340 阅读 · 0 评论 -
A Simple Weight Decay Can Improve Generalization【浅读】
数值模拟表明,权值衰减可以提高前馈神经网络的泛化能力。本文解释了其中的原因。证明了权值衰减在线性网络中有两种作用。首先,它通过选择解决学习问题的最小向量来抑制权向量中任何不相关的分量。其次,如果选择正确的大小,权值衰减可以抑制静态噪声对目标的一些影响,从而大大提高泛化效果。然后展示了如何将这些结果扩展到具有隐藏层和非线性单元的网络。最后利用NetTalk的数据进行了数值模拟,验证了该理论的正确性。这篇文章探讨了权重衰减(weight decay)如何提高神经网络的泛化能力。原创 2024-04-23 23:09:37 · 396 阅读 · 0 评论 -
AAGNet: A graph neural network towards multi-task machining feature【精读】
加工特征识别(MFR)是计算机辅助工艺规划(CAPP)中从CAD模型中的几何实体推断制造语义的重要步骤。传统的基于规则的MFR方法由于表示其可变拓扑结构的复杂性而难以处理相交特征。这激发了基于深度学习的方法的发展,这种方法可以从数据中学习,克服基于规则的方法的局限性。然而,一些现有的深度学习方法在使用某些表示(如体素或点云)时会损害几何和拓扑信息。原创 2024-04-08 00:29:38 · 1618 阅读 · 0 评论 -
FuS-GCN Efficient B-rep based graph convolutional networks for 3D-CAD model classification 【精读】
执行三维计算机辅助设计(3D-CAD)模型分类、检索和重用在工业制造中至关重要,因为它大大缩短了工程开发周期并降低了开发成本。虽然现有的3D模型分类和检索方法在网格或点云上都能取得满意的效果,但不能直接应用于3D- cad模型,3D- cad模型一般采用边界表示(B-rep)。为了解决这一问题,并充分利用B-rep的拓扑结构,提出了一种称为B-rep图的图结构描述符来预处理B-rep数据,并从3D-CAD模型中提取精确的拓扑和几何特征。原创 2024-04-07 18:14:50 · 995 阅读 · 0 评论 -
Hierarchical CADNet Learning from B-Reps for Machining Feature Recognition【精读】
深度学习方法已被证明能够在某些情况下识别计算机辅助设计(CAD)模型中的形状特征(例如加工特征),但在特征相交时仍然存在问题,并且在利用包含典型CAD模型的边界表示(B-Rep)的几何和拓扑信息时仍然存在问题。本文提出了一种新的分层B-Rep图形状表示方法,该方法对B-Rep的曲面几何和面拓扑信息进行编码。原创 2024-04-06 22:43:00 · 1699 阅读 · 0 评论 -
Toward a framework of extracting typical machining process routines
随着CAPP系统的应用,制造企业积累了大量的零件工艺数据,是重要的战略资源。深入挖掘这些工艺数据中隐藏的价值,提高工艺知识的重用率是实现工艺规划智能化的关键。本文建立了一种基于知识表示学习的典型加工过程例程提取框架。首先,建立了描述加工过程的“零件-材料-工艺-机床-刀具”关系的两个图模型,通过图结构的连通性直接表示加工数据的语义。一个模型遵循标准的流程路线,而另一个模型进行了一些修改,使节点“部件”具有更多的内链接和外链接。原创 2024-04-04 23:30:52 · 399 阅读 · 0 评论 -
SolidGen An Autoregressive Model for Direct B-rep Synthesis
边界表示(B-rep)格式是计算机辅助设计(CAD)中实体和薄片对象建模的实际形状表示。最近生成CAD模型的方法集中在学习草图和挤压建模序列上,这些序列由后处理中的实体建模内核执行,以恢复B-rep。在本文中,我们提出了一种新的方法,可以在不需要监督的情况下通过CAD建模序列数据来学习和合成b -代表。我们的方法SolidGen是一个自回归神经网络,通过使用基于变压器和指针的神经网络预测顶点、边缘和面,直接对B-rep进行建模。原创 2024-04-04 23:29:04 · 696 阅读 · 0 评论 -
Simplification of 3D CAD Model in Voxel Form for Mechanical Parts Using Generative Adversarial
大多数机械零件的三维(3D)计算机辅助设计(CAD)模型是在设计阶段创建的,具有很高的形状复杂性。CAD模型的形状复杂度根据应用领域的不同而降低。因此,有必要根据其应用简化三维CAD模型的形状。传统的化简方法是基于预先定义的算法来识别化简目标的形状。这种基于算法的方法难以处理CAD模型中未考虑的不寻常的局部形状。提出了一种基于生成对抗网络(GAN)的网络简化机械零件三维CAD模型的方法。该网络对机械零件三维CAD模型中包含的简化目标形状进行识别和去除。构建三维CAD模型数据集,训练三维CAD模型简化网络。原创 2024-04-04 23:28:07 · 949 阅读 · 0 评论 -
Point2CAD Reverse Engineering CAD Models from 3D Point Clouds
从点云中重建计算机辅助设计(CAD)模型是计算机视觉、图形学和机器学习交叉的一个重要问题;它为设计师在迭代外部对象时节省了大量时间。在这个方向上的最新进展实现了相对可靠的语义分割,但仍然难以产生适当的CAD模型拓扑。在这项工作中,我们分析了当前的艺术状态,为这个不适的任务,并确定现有方法的缺点。我们提出了一种混合分析-神经重建方案,该方案弥合了分割点云和结构化CAD模型之间的差距,并且可以很容易地与不同的分割主干结合。原创 2024-04-04 23:24:50 · 767 阅读 · 0 评论 -
Mates2Motion Learning How Mechanical CAD Assemblies Work
我们描述了我们在使用CAD表示上的深度学习来推断机械装配中配合部件之间的自由度方面的工作。我们使用由CAD零件和零件连接在一起的实际机械组件组成的大型数据集来训练我们的模型。我们提出了重新定义这些伙伴的方法,以使它们更好地反映装配的运动,以及缩小可能的运动轴。我们还进行了用户研究,以创建具有更可靠标签的动作注释测试集。一个用于学习的移动组件的数据集,带有过滤器和修改的表示,以减轻原始组件中发现的错误和歧义。用户注释的验证集。配偶预测任务的基线。原创 2024-04-04 23:24:06 · 236 阅读 · 0 评论 -
Make-A-Shape a Ten-Million-scale 3D Shape Model
在训练自然语言和图像的大型生成模型方面取得了重大进展。然而,3D生成模型的进步受到其大量训练资源需求,以及低效,非紧凑和表达能力差的表示的阻碍。本文介绍了一种新的三维生成模型Make-A-Shape,它是为大规模高效训练而设计的,能够利用1000万个公开可用的形状。在技术方面,我们首先创新了小波树表示,通过制定子带系数滤波方案来有效地利用系数关系,从而紧凑地编码形状。然后,通过设计子带系数填充方案在低分辨率网格中布局表示,通过扩散模型使表示可生成。原创 2024-04-04 23:22:44 · 296 阅读 · 0 评论 -
FeatureNet Machining feature recognition based on 3D Convolution Neural Network
自动化加工特征识别是实体建模的一个分支学科,近三十年来一直是一个活跃的研究领域,是数字化制造过程中从计算机辅助设计(CAD)模型中检测制造信息的关键组成部分。本文提出了一种利用深度三维卷积神经网络(3D- cnn)学习机械零件CAD模型加工特征的新框架——FeatureNet。FeatureNet在大型3D模型数据集上学习复杂制造特征形状的分布,并发现有助于自动识别过程的显著特征。为了对FeatureNet进行训练,自动构建带有标记加工特征的三维CAD模型的大规模机械零件数据集。原创 2024-04-04 23:21:40 · 1197 阅读 · 0 评论 -
Bridging the Gap between Geometry and User Intent Retrieval of CAD Models via Regions of Interest
CAD模型检索是提高产品设计和开发效率的关键功能。基于内容的检索解决方案面临的一个主要挑战是如何弥合几何信息和设计意图之间的语义差距。当前的检索解决方案缺乏根据用户解释和应用程序上下文定制搜索结果的能力。这项工作提出了一个基于异构CAD模型集合的交互式检索系统,该系统利用用户定义的兴趣区域(roi)以直观的方式表达设计意图。我们提出的系统使用自监督学习技术来捕获细微的语义形状关系,并采用非穷举搜索技术来实时执行大规模的部分形状匹配。我们报告了在三个机械部件数据集上的显著性能提高。原创 2024-04-04 23:19:12 · 364 阅读 · 0 评论 -
BrepGen A B-rep Generative Diffusion Model with Structured Latent Geometry
BrepGen是一种基于扩散的生成方法,可直接输出边界表示(B-rep)计算机辅助设计(CAD)模型。BrepGen将B-rep模型表示为层次树中的新型结构化潜在几何结构。根节点表示整个CAD实体,B-rep模型的每个元素(即,面,边或顶点)从上到下逐渐变为子节点。B-rep几何信息作为每个原语的全局边界框与描述局部几何形状的潜在代码一起进入节点。B-rep拓扑信息由节点复制隐式表示。当两个面共用一条边时,该边曲线将在树中出现两次,具有三条关联边的t结点顶点在具有相同节点特征的树中出现六次。原创 2024-04-04 23:18:08 · 1145 阅读 · 0 评论 -
Brep2Seq 【浅读】
这篇论文介绍了一种名为Brep2Seq的新深度学习网络。该网络专注于三维(3D)重建,这是计算机辅助设计(CAD)领域的一个重要研究课题,旨在从原始形状(包括点云、体素、网格和边界表示(B-rep))恢复可编辑的CAD模型。近年来,由于深度学习方法潜力的不断提升,深度模型生成受到了相当大的研究兴趣。为了应对3D重建和生成的挑战,作者提出了Brep2Seq,这是一种新颖的深度神经网络,旨在将B-rep模型转换为一系列可编辑的基于特征的建模操作序列,包括主要原语和详细特征。原创 2024-04-03 08:33:59 · 1038 阅读 · 0 评论 -
Machining feature recognition using BRepNet(加工特征识别)【浅读】
自20世纪80年代以来,利用各种方法对三维(3D)计算机辅助设计(CAD)模型的加工特征进行了许多尝试。近年来,深度学习方法在机械加工特征识别中得到了广泛的应用。然而,边界表示(BRep)模型是3D CAD模型最常见的表示形式,由于其结构复杂,难以直接用于深度学习。为了解决这个问题,最近提出了BRepNet。提出了一种利用BRepNet对以BRep为代表的三维CAD模型进行加工特征识别的方法。在该方法中,基于加工特征,利用BRepNet对三维CAD模型的各个面进行分类。原创 2024-04-03 08:29:30 · 1260 阅读 · 1 评论 -
SECAD-Net Self-Supervised CAD Reconstruction by Learning Sketch-Extrude Operations【浅读】
基于原始几何图形的逆向工程CAD模型是一个经典而又艰苦的研究问题。以前的基于学习的方法由于受监督的设计模式而严重依赖于标签或重建CAD形状,这些形状不易编辑。在这项工作中,我们介绍了SECADNet,一个端到端神经网络,旨在以自监督的方式重建紧凑且易于编辑的CAD模型。从现代CAD软件中最常用的建模语言中汲取灵感,我们建议从原始形状中学习2D草图和3D挤出参数,从中可以通过将每个草图从2D平面挤压成3D体来生成一组挤出圆柱体。通过合并布尔运算(即联合),这些圆柱体可以紧密地接近目标几何形状。原创 2024-04-03 08:28:14 · 432 阅读 · 1 评论 -
AutoMate A Dataset and Learning Approach for Automatic Mating of CAD Assemblies【浅读】
这篇文章介绍了使用深度学习方法来预测计算机辅助设计(CAD)中的装配关系(mates)。提出了一种新的基于边界表示(BREPs)的图神经网络SB-GCN,可以学习不同拓扑实体(面、边、顶点等)的嵌入表示。这是第一个异构的BREP表示学习模型。收集并整理了第一个大规模的基于BREP的装配建模数据集,包含180,102个装配关系。应用SB-GCN来预测装配关系的位置和类型。位置预测准确率达到72.2%,类型预测准确率达到70%。原创 2024-04-03 08:22:12 · 497 阅读 · 0 评论 -
Machining Feature Recognition Method Based on Improved Mesh Neural Network【浅读】
加工特征识别是连接计算机辅助设计(CAD)和计算机辅助工艺规划(CAPP)系统的桥梁,是实现CAD、CAPP和计算机辅助制造(CAM)一体化的关键技术。为了克服传统CAPP系统识别效率低和智能水平低的问题,有效识别加工特征,本文提出了一种基于MeshFaster RCNN的机械零件加工特征识别方法,该方法将原有的MeshCNN模型与Faster RCNN模型相结合。基于改进的MeshNet网格识别框架,构建了一种卷积神经网络,用于加工曲面网格数据的自动加工特征识别。原创 2024-04-03 08:19:47 · 974 阅读 · 0 评论 -
Hierarchical pyramid attentive network with spatial separable convolution for crowd counting【即插即用】
为了解决人群计数任务中具有挑战性的尺度变化问题,提高计数精度,提出了一种基于层次金字塔关注网络(HPANet)的人群计数新方法。具体而言,设计了一个尺度感知的金字塔关注(SPA)块,提取丰富的多尺度上下文,以两分支空间可分卷积为核心组件,取代传统的核尺寸更大的纯卷积来减少计算量,并对空间特征聚合采用自关注操作。为了进一步从输入图像中更好地学习尺度感知特征表示,我们将设计的SPA块分层堆叠,并灵活融合其特征,作为HPANet的另一个关键模块——层次化特征融合(HFF)模块。原创 2024-04-03 08:18:27 · 239 阅读 · 0 评论 -
Reconstruction of design history of 3D CAD models using deep learning research trends【浅读】
设计历史重建是指识别组成计算机辅助设计(CAD)模型的特征,确定与这些特征相关的参数值,并建立特征应用的顺序的过程。当使用缺乏设计历史的CAD模型时,这是必要的。虽然商业CAD程序通常支持设计历史作为其主要表示形式,但由于标准CAD文件格式的限制或对设计知识的保护,在许多情况下,设计历史通常会丢失。这种设计历史的丢失会使修改CAD模型变得具有挑战性,并可能导致更高的产品设计成本。自20世纪80年代末以来,设计历史重构的研究一直在进行,以解决这一问题。然而,之前的研究一直在努力寻找可以广泛应用的解决方案。原创 2024-04-01 00:16:36 · 354 阅读 · 0 评论 -
RendNet Unified 2D3D Recognizer with Latent Space Rendering【浅读】
矢量图形(VG)在我们的日常生活中无处不在,在工程、建筑、设计等领域有着广泛的应用。大多数现有方法的VG识别过程是先将VG渲染成栅格图形(RG),然后根据RG格式进行识别。但是,这种方法丢弃了几何图形的结构,失去了VG的高分辨率。最近,另一类算法被提出直接从原始VG格式进行识别。但它受到拓扑错误的影响,而拓扑错误可以通过RG渲染过滤掉。与其只看一种格式,不如同时使用VG和RG格式来避免这些缺点,这是一个很好的解决方案。此外,我们认为VG-to-RG渲染过程是有效结合VG和RG信息的关键。原创 2024-03-31 23:20:48 · 313 阅读 · 0 评论 -
Neural Face Identification in a 2D Wireframe Projection of a Manifold Object【浅读】
在计算机辅助设计(CAD)系统中,二维线条图通常用于说明三维对象设计。要重建由单个2D线条绘制的3D模型,一个重要的关键是在线条绘制中找到与3D对象的实际面相对应的边缘环。在本文中,我们从一个新的数据驱动的角度来解决人脸识别的经典问题。我们将其作为一个序列生成问题:从任意的边开始,我们采用流行的Transformer模型的变体,以自然顺序预测与同一面相关的边。原创 2024-03-31 19:44:30 · 331 阅读 · 0 评论 -
JoinABLe Learning Bottom-up Assembly of Parametric CAD Joints【浅读】
实体产品通常是由计算机辅助设计(CAD)软件建模的大量3D部件组合而成的复杂组件。CAD设计人员通过使用称为接头的约束将单个部件对齐来构建这些组件。本文介绍了一种基于学习的方法JoinABLe,它可以将零件组装在一起形成关节。JoinABLe使用标准参数化CAD文件中可用的弱监督,而无需对象类标签或人工指导。我们的结果表明,通过在实体模型的图形表示上进行网络预测,我们可以以接近人类表现(80%)的准确率(79.53%)胜过多个基线方法。原创 2024-03-31 19:31:23 · 517 阅读 · 0 评论 -
PrimitiveNet 【浅读】
我们提出了PrimitiveNet,一种用于大规模点云的高分辨率原始实例分割的新方法。我们的关键思想是将全局分割问题转化为更容易的局部任务。我们训练了一个高分辨率的原始嵌入网络来预测每个点的显式几何特征和隐式潜在特征。该嵌入与一个对抗网络共同训练,作为一个原始判别器来判断点是否来自局部邻域的同一原始实例。这种局部监督鼓励学习嵌入和判别器描述局部表面性质,并鲁棒区分不同的实例。在推理阶段,网络预测后采用区域增长方法完成分割。原创 2024-03-31 19:09:20 · 462 阅读 · 0 评论 -
FFA-Net: Feature Fusion Attention Network for Single Image Dehazing【即插即用】
本文提出了一种端到端特征融合关注网络(FFA-Net)来直接恢复无雾图像。FFA-Net架构由三个关键部分组成:1)考虑到不同的通道特征包含完全不同的加权信息以及不同图像像素上的雾霾分布不均匀,一种新颖的特征注意(FA)模块将通道注意与像素注意机制结合起来。FA对不同的特征和像素的处理是不平等的,这为处理不同类型的信息提供了额外的灵活性,扩展了cnn的表示能力。原创 2024-03-31 11:44:29 · 1201 阅读 · 0 评论 -
Attentional Feature Fusion(注意特征融合)【即插即用】
特征融合是将不同层或分支的特征结合在一起,是现代网络体系结构中无处不在的一部分。它通常通过简单的操作来实现,比如求和或连接,但这可能不是最好的选择。在这项工作中,我们提出了一个统一和通用的方案,即注意力特征融合,它适用于大多数常见的场景,包括由短跳连接和长跳连接引起的特征融合,以及盗梦层内的特征融合。为了更好地融合语义和尺度不一致的特征,我们提出了一个多尺度通道注意力模块,该模块解决了融合不同尺度特征时出现的问题。原创 2024-03-31 11:11:47 · 2113 阅读 · 1 评论 -
SimAM A Simple, Parameter-Free Attention Module for Convolutional Neural Networks【即插即用】
在本文中,我们为卷积神经网络(ConvNets)提出了一个概念简单但非常有效的注意力模块。与现有的通道智能和空间智能注意力模块相比,我们的模块在不向原始网络添加参数的情况下推断出层中特征映射的三维注意力权重。具体来说,我们基于一些著名的神经科学理论,提出优化能量函数来找到每个神经元的重要性。我们进一步推导了能量函数的快速封闭解,并表明该解可以在不到十行代码中实现。该模块的另一个优点是,大多数算子都是根据定义的能量函数的解来选择的,避免了过多的结构调整工作。原创 2024-03-31 10:22:45 · 1153 阅读 · 0 评论 -
PnPNet Pull-and-Push Networks for Volumetric Segmentation with Boundary Confusion【即插即用】
体积图像的精确边界分割是图像引导诊断和计算机辅助干预的关键任务,特别是在临床实践中边界混淆。然而,由于缺乏边界形状约束,u形深度网络无法有效解决这一挑战。此外,现有的边界细化方法过分强调细长结构,由于神经网络对微小物体的建模能力有限,导致神经网络出现过拟合现象。在本文中,我们重新定义了边界生成的机制,包括与邻近区域相互作用的动力学。此外,我们提出了一个统一的网络,称为PnPNet,以模拟混淆边界区域的形状特征。PnPNet的核心成分包括推分支和拉分支。原创 2024-03-31 09:51:43 · 995 阅读 · 1 评论 -
Coordinate Attention for Efficient Mobile Network Design【即插即用】
最近关于移动网络设计的研究已经证明了通道注意(例如,挤压和激励注意)对于提高模型性能的显着有效性,但它们通常忽略了位置信息,而位置信息对于生成空间选择性注意图非常重要。在本文中,我们提出了一种新的移动网络注意机制,将位置信息嵌入到通道注意中,我们称之为“坐标注意”。与通过二维全局池化将特征张量转换为单个特征向量的通道注意不同,坐标注意将通道注意分解为两个一维特征编码过程,分别沿着两个空间方向聚合特征。这样可以在一个空间方向上捕获远程依赖关系,同时在另一个空间方向上保持精确的位置信息。原创 2024-03-31 09:20:35 · 224 阅读 · 0 评论 -
EGE-UNet An Efficient Group Enhanced UNet for Skin Lesion Segmentation【即插即用】
及其变体在医学图像分割中有着广泛的应用。然而,这些模型的大量参数和计算量使其不适合移动医疗应用。为了解决这个问题,我们提出了一种更有效的方法,即高效组增强UNet (EGE-UNet)。我们以轻量级的方式集成了一个组多轴Hadamard产品关注模块(GHPA)和一个组聚合桥模块(GAB)。GHPA对输入特征进行分组,并在不同轴上执行Hadamard产品注意机制(HPA),从不同角度提取病理信息。GAB通过分组低阶特征、高阶特征和解码器在每个阶段生成的掩码,有效地融合了多尺度信息。原创 2024-03-31 09:16:59 · 842 阅读 · 0 评论 -
TOPOLOGY-AWARE LATENT DIFFUSION FOR 3D SHAPE GENERATION【阅读笔记】
我们引入了一种新的生成模型,该模型结合了潜在扩散和持久同源性来创建具有高度多样性的3D形状,并特别强调了它们的拓扑特征。我们的方法包括将3D形状表示为隐式字段,然后使用持久同调来提取拓扑特征,包括贝蒂数和持久图。形状生成过程包括两个步骤。首先,我们使用基于转换器的自动编码模块将每个3D形状的隐式表示嵌入到一组潜在向量中。随后,我们通过扩散模型浏览学习到的潜在空间。通过将拓扑特征策略性地整合到扩散过程中,我们的生成模块能够产生具有不同拓扑结构的更丰富的3D形状。原创 2024-03-31 09:03:52 · 492 阅读 · 0 评论 -
A Convolutional Neural Network Approach to the Classification of Engineering Models【阅读笔记】
本文提出了一种使用卷积神经网络(cnn)对工程(CAD)模型进行分类的深度学习方法。由于大量带注释的数据集的可用性以及gpu形式的足够计算能力,最近提出了许多基于深度学习的对象分类解决方案,特别是在图像和图形模型领域。然而,对于CAD模型的功能分类任务,很少有解决方案被提出。因此,在本研究中,CAD模型已从工程形状基准(ESB),国家设计库(NDR)中收集,并使用建模软件创建的新模型进行扩充,以形成数据集-“CADNET”。受流行的ResNet的启发,提出在CADNET中使用残差网络架构。原创 2024-03-31 09:00:39 · 945 阅读 · 0 评论 -
Rethinking Mobile Block for Efficient Attention-based Models【即插即用】
本文的重点是在权衡参数、FLOPs和性能的同时,为密集预测开发现代、高效、轻量级的模型。倒立残差块(IRB)是轻量级cnn的基础结构,但在基于注意力的研究中还没有相应的基础结构。本文从高效IRB和Transformer的有效组件的统一角度重新思考轻量级基础架构,将基于cnn的IRB扩展到基于注意力的模型,并抽象出一个用于轻量级模型设计的单残留元移动块(MMB)。根据简单而有效的设计准则,我们推导出了一种现代的反向残差移动块(iRMB),并构建了一个只有iRMB的类resnet高效模型(EMO)用于下游任务。原创 2024-03-28 23:25:25 · 712 阅读 · 0 评论 -
SEAFORMER SQUEEZE-ENHANCED AXIAL TRANSFORMER FOR MOBILE SEMANTIC SEGMENTATION【即插即用】
自从引入VIT以来,许多计算机视觉任务(例如,语义分割)的前景一直由cnn压倒性地主导,最近发生了重大变革。然而,计算成本和内存需求使得这些方法不适合移动设备,特别是对于高分辨率的逐像素语义分割任务。本文介绍了一种新的用于移动语义分割的挤压增强轴向Transformer(SeaFormer)方法。具体来说,我们设计了一个通用的注意力块,其特点是挤压轴和细节增强的配方。它可以进一步用于创建一系列具有卓越成本效益的骨干体系结构。原创 2024-03-28 23:17:07 · 569 阅读 · 0 评论 -
Hierarchical pyramid attentive network with spatial separable convolution for crowd counting(即插即用)
为了解决人群计数任务中具有挑战性的尺度变化问题,提高计数精度,提出了一种基于层次金字塔关注网络(HPANet)的人群计数新方法。具体而言,设计了一个尺度感知的金字塔关注(SPA)块,提取丰富的多尺度上下文,以两分支空间可分卷积为核心组件,取代传统的核尺寸更大的纯卷积来减少计算量,并对空间特征聚合采用自关注操作。为了进一步从输入图像中更好地学习尺度感知特征表示,我们将设计的SPA块分层堆叠,并灵活融合其特征,作为HPANet的另一个关键模块——层次化特征融合(HFF)模块。原创 2024-03-28 00:32:29 · 691 阅读 · 0 评论 -
PnP-3D: A Plug-and-Play for 3D Point Clouds【即插即用】
在深度学习范式的帮助下,人们发明了许多用于视觉分析的点云网络。然而,由于点云数据的给定信息尚未得到充分利用,这些网络的发展潜力很大。为了提高现有网络在分析点云数据方面的有效性,我们提出了一个即插即用模块PnP-3D,旨在通过从显式三维空间和隐式特征空间中引入更多的局部上下文和全局双线性响应来改进基本点云特征表示。为了彻底评估我们的方法,我们在三个标准点云分析任务上进行了实验,包括分类、语义分割和目标检测,我们从每个任务中选择了三个最先进的网络进行评估。原创 2024-03-28 00:05:14 · 870 阅读 · 0 评论