- 博客(355)
- 收藏
- 关注
原创 优质GAN模型专栏目录
生成模型,通常用于生成逼真的数据(如图像、视频、音频等)。特别是生成模型,GANs、DDPM等在多个领域中得到了广泛的应用,且其优点也使得它在很多场景中表现出色。包括生成高质量数据、无监督学习、数据增强、灵活性和适应性、高效的表示学习、创新的生成能力、对抗训练的鲁棒性该专栏主要利用Pytorch框架复现关于图像生成模型系列论文代码。
2025-02-23 10:00:00
676
原创 (论文速读)ActiveEventNet:基于活动事件的立体视觉
一种创新的主动事件立体视觉系统,结合双目事件相机与红外投影仪实现高速深度感知。研究团队构建了硬件原型并创建了包含真实(21.5k标签)和合成(23.8k标签)数据的双模态数据集。提出的轻量级ActiveEventNet网络通过动态交互代价体和MobileNet架构,在保持精度的同时实现150FPS推理速度。实验表明,该系统在低光和高速场景中显著优于传统方法,EPE误差降低23.7%,速度提升12倍。这种新模式为高速机器人、AR/VR等应用提供了突破性解决方案。
2026-01-03 22:40:49
925
原创 (论文速读)GraphSAGE:大型图的归纳表示学习
GraphSAGE,一种用于大型图归纳表示学习的创新框架。与传统的直推式节点嵌入方法不同,GraphSAGE通过学习节点特征聚合函数而非单独节点嵌入,实现了对未见节点的有效泛化。该方法通过采样固定数量邻居并采用三种聚合策略(Mean、LSTM、Pooling)生成节点嵌入,在引文网络、Reddit社区和蛋白质相互作用数据集上显著优于基线方法,最高提升55%准确率。理论分析证明GraphSAGE能有效捕捉图结构特征,特别适合处理动态变化的图数据,为推荐系统、社交网络分析等领域提供了高效解决方案。
2026-01-03 22:40:36
995
原创 (论文速读)ScopeViT: 缩放感知视觉变压器
一种名为ScopeViT的尺度感知视觉Transformer,通过两种新型注意力机制有效捕获多尺度特征。多尺度自注意力(MSSA)将不同感受野的视觉标记嵌入不同注意力头,实现多粒度感知;全局尺度扩展注意力(GSDA)通过令牌扩展减少计算量。ScopeViT在ImageNet-1K上仅用7.4M参数和2.0G FLOPs即达到81.1%的top-1准确率,相比Swin节省42%参数提升1.9%准确率,相比MobileViTv2减少50%计算量提升0.7%准确率。
2026-01-03 00:33:23
1083
原创 (论文速读)Unified Modality Separation: 无监督领域自适应的视觉语言框架
一种新颖的视觉语言框架UniMoS++,用于解决无监督域适应中的模态间隙问题。不同于传统方法强制对齐视觉和文本模态,该框架通过分离模态特定组件(VAC和LAC)并保留模态不变知识,实现了更有效的跨域知识迁移。创新性地设计了模态差异指标(MDI)对样本进行分类,以及测试时自适应集成算法(MaE)自动优化模态权重。实验表明,该方法在多个基准数据集上显著提升性能(最高达9%),同时计算效率提升9倍。该工作为利用预训练视觉语言模型进行域适应提供了新思路,在保持模态特性的同时实现有效的知识迁移。
2026-01-03 00:33:12
1124
原创 (论文速读)MPNN:量子化学的神经信息传递
提出了消息传递神经网络(MPNNs)框架,统一了多种量子化学预测中的图神经网络模型。MPNN通过迭代的消息传递和聚合过程计算分子性质,具有图同构不变性。作者在MPNN框架内创新性地引入了边网络、虚拟图元素、Set2Set读出函数和多塔架构等改进。在QM9数据集上的实验表明,该方法在13个分子性质预测任务中均达到或超越化学精度要求,显著优于现有方法。特别是对于偶极矩和电子空间范围等关键性质,误差比率较最佳基线降低了57-83%。该研究为分子性质的快速准确预测提供了强大工具,为药物发现和材料科学开辟了新途径。
2026-01-02 00:44:12
742
原创 (论文速读)LightGCN:简化和增强图卷积网络的推荐
LightGCN模型,通过简化传统图卷积网络(GCN)的设计来提升推荐系统性能。研究发现,GCN中的特征变换和非线性激活操作在协同过滤任务中不仅无益反而有害。LightGCN仅保留核心的邻域聚合组件,采用线性传播方式学习用户和物品嵌入,并通过各层嵌入的加权组合作为最终表示。实验表明,该模型在相同设置下比现有最佳GCN推荐模型性能提升约16%,且更易实现和训练。理论分析证实了这种简化设计的合理性,为推荐系统中的图神经网络应用提供了新思路。
2026-01-02 00:44:01
1019
原创 (论文速读)GIN:理论上最强大的GNN架构
分析了图神经网络(GNN)的表达能力,揭示了其理论局限。研究表明,现有GNN变体(如GCN和GraphSAGE)无法区分某些简单图结构,因其聚合函数不具备单射性。基于此,作者提出了理论上最具表达力的GIN架构,该模型采用求和聚合与多层感知机组合,其判别能力与Weisfeiler-Lehman同构测试相当。实验验证了理论发现,GIN在多个图分类基准上达到最优性能。该研究为GNN设计提供了重要理论指导,明确了不同聚合函数的适用场景与局限性。
2025-12-31 14:11:32
762
原创 ShortDF模型训练自己的数据集指南
ShortDF(最短路径扩散模型),一种基于图论优化的去噪扩散模型。该模型通过将去噪过程建模为最短路径问题,显著提高了生成效率和质量。实验显示,ShortDF在CIFAR-10和CelebA等数据集上,仅需2-10步即可达到优于传统DDIM(100步)的效果,FID指标提升18.5%-52.8%。文章详细提供了从环境配置、数据集准备到训练优化的完整指南,包括常见问题解决方案和不同分辨率下的参数配置建议。源代码已开源,支持自定义数据集训练,为快速高质量图像生成提供了新思路。
2025-12-31 14:11:08
27
原创 (论文速读)CCASeg:基于卷积交叉注意的语义分割多尺度上下文解码
CCASeg,一种基于卷积交叉注意力的新型语义分割解码方案。针对现有Transformer解码器在计算成本和多尺度上下文捕获上的局限性,该方法创新性地采用不同大小的卷积核来高效捕获局部和全局上下文信息。通过卷积交叉注意力(CCA)模块、连续特征集成(SFI)机制和渐进式解码架构,CCASeg实现了多层级特征的高效融合。实验表明,在ADE20K、Cityscapes等基准数据集上,CCASeg在显著降低计算量的同时提升了分割精度,尤其在小物体识别和边界处理上表现突出。
2025-12-30 16:15:47
657
原创 (论文速读)基于物理导图卷积网络的工业复合材料损伤严重程度和区域识别
一种物理引导的图卷积网络(GCN)框架,用于碳纤维增强聚合物(CFRP)层合板的损伤评估和定位。通过将Lamb波信号转化为图表示,设计了三种邻接矩阵变体:全连接(GCN-FC)、激励器聚类(GCN-CA)和共享传播路径(GCN-CP)。实验结果表明,物理引导的GCN-CA和GCN-CP模型显著优于传统方法,仅用4个传感器即实现96.09%的损伤程度识别和99.09%的定位准确率。该方法突破了传统监测系统依赖密集传感器和复杂成像的局限,为复合材料结构健康监测提供了高效解决方案。
2025-12-30 16:15:26
764
原创 (论文速读)LLIE:即插即用图像增强模型,用于低光照条件下的端到端物体检测
轻量级即插即用模型LLIE,通过端到端训练显著提升低光照下的目标检测性能。传统两步法(先增强图像再检测)因优化目标不一致导致检测性能下降,而LLIE创新地采用局部自适应参数矩阵和锐化模块,直接优化检测任务所需的特征。实验显示,在ExDark等数据集上,LLIE使YOLOv3等检测器mAP提升2-3%,且推理时间仅增加60%(参数量77k)。关键突破在于:1)检测器梯度反向指导增强参数学习;2)像素级局部调整与全局锐化协同;3)无需配对数据,仅需检测标注。
2025-12-29 14:49:23
652
原创 (论文速读)ShortDF:扩散去噪模型中最短路径的优化
ShortDF模型,通过将去噪过程建模为最短路径问题,优化扩散模型的效率和生成质量。该模型利用图论思想,将初始残差作为备选路径嵌入损失函数,动态压缩重构路径。实验表明,ShortDF在CIFAR-10、CelebA等数据集上显著减少扩散步骤(2步生成FID降低18.5%),同时保持视觉保真度。这项工作为实时图像生成应用提供了新思路。核心创新在于将经典最短路径算法与扩散模型结合,实现了速度与质量的平衡。
2025-12-29 14:48:56
1449
原创 (论文速读)VJTNN+GAN分子优化的图到图翻译
一种基于图到图转换的分子优化方法,将分子优化建模为多模态图翻译问题。通过连接树编码器-解码器架构,模型能够学习分子结构间的有效转换,并使用潜在向量显式控制不同输出分布。创新性地采用对抗训练方法对齐分子分布,解决了分子优化中输出多样性的关键挑战。实验表明,该方法在多个分子优化任务上显著优于现有基线,在提升分子性质的同时保持生成多样性和新颖性。这项研究为分子设计提供了新的端到端学习框架,对药物发现领域具有重要价值。
2025-12-27 10:01:43
1130
原创 (论文速读)VGAE:变分图自动编码器
变分图自编码器(VGAE),一种基于变分自编码器的无监督图结构数据学习框架。该模型通过图卷积网络编码器和内积解码器,学习图的潜在表示。实验表明,在引文网络链接预测任务中,VGAE通过有效结合节点特征,性能显著优于谱聚类和DeepWalk等基线方法。特别地,引入节点特征可使AUC提升7.4%-11.9%,验证了模型的有效性。VGAE为图表示学习提供了简洁而强大的解决方案。
2025-12-27 10:01:16
1020
原创 (论文速读)STSGCN:时空同步图卷积网络
一种新颖的时空同步图卷积网络(STSGCN)框架,用于时空网络数据预测。该方法通过构建局部化时空图实现时空维度的统一建模,设计同步图卷积模块直接捕获复杂的时空相关性,并采用多模块架构处理时空异质性。在四个真实交通数据集上的实验表明,STSGCN显著优于传统分离建模方法,在MAE和MAPE指标上均达到最优性能。消融实验验证了各创新组件的有效性,特别是多模块设计对处理时空异质性的重要作用。该研究为时空数据建模提供了新思路,强调了同步考虑时空维度的重要性。
2025-12-26 11:37:54
1002
原创 (论文速读)Graph Transformer:变压器网络的图化
GraphTransformer,将Transformer架构推广到任意图结构数据。针对原始Transformer全连接注意力机制不适用于稀疏图的问题,该模型引入四个关键改进:(1)基于邻域连接的稀疏注意力机制;(2)采用拉普拉斯特征向量作为位置编码;(3)用批归一化替代层归一化;(4)支持边特征表示。实验表明,这种设计在保持计算效率的同时,显著优于传统GNN和全连接Transformer变体。该工作为图数据处理提供了简洁有效的通用框架,在分子性质预测等任务中展现出优势。
2025-12-26 11:36:47
1160
原创 (论文速读)GAT:图注意神经网络
本文介绍了图注意力网络(GAT),一种新颖的神经网络架构,用于处理图结构数据。GAT通过自注意力机制克服了传统图卷积网络的局限性,能够自适应地为不同邻居节点分配权重,无需复杂矩阵运算或依赖固定图结构。该模型在Cora、Citeseer、Pubmed引文网络和蛋白质-蛋白质相互作用数据集上取得了优异表现,特别在归纳学习任务中显著优于GraphSAGE方法36.1%。GAT的计算复杂度与GCN相当,同时提供了更好的可解释性,已成为图神经网络领域的重要基准模型。
2025-12-25 16:37:25
767
原创 (论文速读)GCN:基于图卷积网络的半监督分类
本文介绍了ICLR 2017发表的图卷积网络(GCN)经典论文,提出了一种基于谱图理论简化的半监督图学习方法。通过一阶近似和重归一化技巧,GCN实现了线性时间复杂度,在引文网络数据集上显著优于传统方法。实验表明,该模型在Cora、Citeseer和Pubmed数据集上达到最优性能,同时揭示了模型深度和参数选择的影响。尽管存在内存需求等局限性,GCN为图神经网络研究奠定了基础,成为该领域的重要里程碑。
2025-12-25 16:36:00
1282
原创 (论文速读)基于事件的低照度图像增强-LIE数据集
一种基于事件相机的低照度图像增强方法,利用事件相机的高动态范围特性(140dB)与传统相机的互补优势,实现了2勒克斯以下极低照度场景的高质量图像重建。创新性地提出了残差融合模块(RFM)来减小事件流与帧图像间的域差异,并设计了基于对比度分布可变性的多级重建损失函数。同时建立了首个真实世界低照度图像增强数据集LIE,包含室内外场景的事件流、欠曝光帧及对应真实图像。实验表明,该方法在PSNR、SSIM和LPIPS指标上显著优于现有技术,尤其在保留细节和色彩还原方面表现突出。
2025-12-24 14:03:08
942
原创 (论文速读)基于M-LLM的高效视频理解视频帧选择
本文提出了一种基于多模态大语言模型(M-LLM)的自适应视频帧选择方法,以提高视频理解效率。针对现有均匀采样方法可能导致关键帧丢失的问题,该方法通过轻量级帧选择器,结合空间和时间双重监督信号,智能选取与问题相关的视频帧。实验表明,该方法在中长视频问答任务上显著提升性能(最高+3.7%),并能用更少帧数达到更好效果(4帧接近32帧的均匀采样效果)。核心创新在于问题导向的帧选择策略,仅需1.5B参数即可指导更大模型的高效推理,为视频理解提供了按需观看的新范式。
2025-12-24 14:02:29
1319
原创 (论文速读)RoShuNet:一个轻量级的基于卷积神经网络的可见图像特征提取器
一种轻量级卷积神经网络RoShuNet,用于可见图像的特征提取。通过三个关键改进:聚合对偶群卷积模块使网络更紧凑,γ加权洗牌模块优化信道互流,以及瘦身策略降低模型复杂度。实验表明,RoShuNet在分类任务中准确率优于ShuffleNetV2,同时模型更小;在语义分割和多目标跟踪任务中也表现出色,具有更高的计算效率。该方法为轻量化模型设计提供了新思路。
2025-12-23 00:22:21
695
原创 (论文速读)ICEv2:视觉转换器的可解释性、全面性和可解释性
ICEv2方法,用于提升视觉转换器(ViT)的可解释性可视化效果。针对现有方法依赖注意力分数、需微调整个模型等局限,ICEv2创新性地利用输出补丁嵌入直接预测每个位置的类别,通过对抗归一化机制实现前景背景分离。该方法仅需微调最后3层编码器,在保持模型属性的同时显著降低计算成本。实验表明,ICEv2在ImageNet和PascalVOC数据集上的分割性能优于现有方法,并能有效处理未见类别,展示了优异的泛化能力。该研究为理解ViT的决策机制提供了新思路。
2025-12-23 00:22:05
907
原创 (论文速读)基于无监督Kolmogorov-Arnold自编码器和导波的复合材料结构无基线损伤检测与定位
一种基于无监督Kolmogorov-Arnold自编码器(KAE)和改进概率椭圆成像算法(MRAPID)的混合框架,用于复合材料结构的无基线损伤检测与定位。该方法利用KAE自动处理导波信号,无需预先特征提取,通过重建误差识别损伤,并结合MRAPID算法实现损伤定位。实验结果表明,该方法在风力机叶片和复合材料平板上均能有效检测和定位单/多损伤,定位精度(RMSE 14.20mm)优于传统方法。该技术摆脱了对基线数据的依赖,为结构健康监测提供了新的解决方案。
2025-12-22 12:25:51
1099
原创 (论文速读)CTW-DCNN:一种检测碳纤维增强塑料内部分层的新方法
一种基于兰姆波和深度学习的碳纤维复合材料损伤检测新方法。通过连续小波变换将一维信号转换为时频图像,并利用卷积神经网络自动提取特征进行分类。实验验证表明,该方法对复合材料内部分层损伤的检测准确率高达99.17%,且能精确定位损伤区域。相比传统方法,该数据驱动方案避免了复杂的手工特征提取,展现了深度学习在结构健康监测中的优势。研究成果为复合材料损伤检测提供了高效可靠的解决方案,具有重要的工程应用价值。
2025-12-22 12:25:39
919
原创 (论文速读)Motion Mamba:高效和长序列运动生成
MotionMamba,一种基于状态空间模型(SSM)的高效长序列人体运动生成方法。针对现有扩散模型在长序列建模和推理效率上的不足,设计了分层时间曼巴(HTM)块和双向空间曼巴(BSM)块,分别处理运动序列的时序一致性和空间精确性。实验表明,在HumanML3D和KIT-ML数据集上,该方法FID提升50%,推理速度提高4倍,并展现出优异的长序列生成能力。创新性地将SSM引入运动生成任务,为实时高质量运动生成提供了新范式。
2025-12-20 16:28:15
1164
原创 (论文速读)Smooth Diffusion:在扩散模型中制作平滑的潜在空间
SmoothDiffusion:针对扩散模型潜在空间平滑性问题提出了创新解决方案。研究发现,现有扩散模型在潜在空间的微小扰动会导致输出图像的剧烈波动,严重影响图像插值、反演和编辑等任务。为此,作者提出了SmoothDiffusion模型,通过引入逐步变化正则化方法,强制要求输入潜在变化与输出图像变化保持恒定比例关系。同时,设计了ISTD指标定量评估潜在空间平滑性。实验表明,该方法在保持生成质量的同时显著提升平滑性(ISTD下降57%),并在多项下游任务中展现出优越性能
2025-12-20 16:09:23
953
1
原创 (论文速读)LCT:用于RGB-D突出物体检测的轻型跨模态变压器
一种用于RGB-D显著性目标检测的轻量级跨模态Transformer(LCT),在显著降低计算成本的同时保持优异性能。LCT采用中级特征融合结构和轻量级Transformer骨干网络,设计跨模态增强融合模块(CEFM)和双向多级特征交互模块(Bi-MFIM),分别通过轻量级通道/空间交叉注意力有效捕获跨模态和跨层次互补信息。实验表明,LCT仅需2.8M参数和7.6GFLOPs,运行速度达66FPS,在多个基准数据集上取得与重量级模型相当甚至更好的性能。
2025-12-19 00:08:02
655
原创 (论文速读)基于导波的飞机机身弦复杂连接结构损伤诊断
针对飞机机身弦复杂连接结构的损伤诊断问题,提出基于导波的监测方法。由于机身结构多为铆接连接,其接头部位易产生疲劳裂纹且难以人工检测。研究分析了带弦条单带对接结构中不同通道导波信号的传播特性,通过模拟损伤实验考察了多层铆接结构对损伤识别的影响。结果表明,传感器布置需针对监测区域,特定通道能有效识别长桁接头裂纹,损伤指数随裂纹扩展呈规律性增长。三个试件验证了方法的可靠性和重复性,为飞机复杂连接结构的健康监测提供了有效解决方案。
2025-12-19 00:07:33
753
原创 (论文速读)ZeST:零拍摄材料转移从一个单一的图像
ZeST方法,通过巧妙结合预训练模型实现无需训练的材质转移。该方法利用IP-Adapter提取材质特征,借助深度图保持几何形状,采用前景灰度化保留光照信息,形成三支路架构。实验表明,ZeST在合成和真实数据集上均优于基线方法,支持多物体编辑和光照感知转移。虽然存在部分转移和多材质混合的局限,但ZeST将专业材质编辑简化为15秒操作,为游戏、电商、影视等行业带来革新。该技术展现了预训练模型的潜力,使复杂任务无需训练即可完成。
2025-12-18 00:41:08
894
原创 (论文速读)基于迁移学习的大型复杂结构冲击监测
一种基于迁移学习的稀疏传感器阵列冲击监测方法,用于大型复杂飞机结构。通过将结构划分为区域并采用两步策略:首先利用卷积神经网络(CNN)进行区域定位,再通过加权质心法精确定位冲击点。针对数据获取困难问题,采用迁移学习策略,将源域模型特征知识迁移至目标域,显著降低训练成本。实验表明,该方法在3750mm×2000mm铝合金板上实现平均相对误差4.6%(x)和6.1%(y),验证了其在减少传感器数量同时保持监测精度的有效性。该研究为航空结构健康监测提供了创新解决方案。
2025-12-18 00:40:43
947
原创 Wonder3D: 跨域扩散的单图像3D重建技术
Wonder3D提出了一种高效的单视图图像到3D重建方法,通过跨域扩散模型生成多视角法线贴图和彩色图像,结合几何感知融合算法,在2-3分钟内输出高保真纹理网格。相比传统方法,其创新点包括:1)统一模型通过域切换器生成法线图和彩色图;2)跨域注意力机制确保多视角几何一致性;3)几何感知权重优化表面重建。实验表明,该方法在质量、速度和泛化性上均优于现有技术,为游戏、电商等领域提供了高效的3D生成方案。
2025-12-17 14:26:13
910
原创 (论文速读)CoLIE:基于上下文的快速弱光图像增强方法的神经隐式表征
CoLIE,一种基于神经隐式表示的零样本低光图像增强方法。该方法将增强问题重新定义为从2D坐标到照明分量的映射,在HSV空间仅增强亮度分量以保持色彩保真度。创新性地引入局部上下文窗口和引导滤波上采样策略,结合无参考损失函数,实现了无需预训练的高效增强。实验表明,CoLIE在多个数据集上超越现有方法,在下游视觉任务中展现出实用价值。该方法为低光增强提供了新的解决思路。
2025-12-17 14:24:25
991
原创 (论文速读)卷积层谱范数的紧凑高效上界
一种计算卷积层谱范数的新方法,通过将四维卷积核视为张量,证明了其张量谱范数可作为卷积Jacobian矩阵谱范数的紧致上界。与现有方法相比,该上界具有输入分辨率无关性、可微性和高效计算特性(使用HOPM算法)。实验表明,该方法显著提高了谱范数估计精度(误差<10%),并能有效提升模型性能:在CIFAR100上使用提出的正交正则化方法使准确率提升2.15%。该方法为控制CNN的Lipschitz常数提供了理论保证和实用工具。
2025-12-16 00:57:43
721
原创 (数据集)H-V2X:用于纯电动汽车感知的大规模公路数据集
H-V2X:首个大规模高速公路BEV感知数据集 本文提出了H-V2X数据集,这是首个专为高速公路场景设计的大规模路侧感知数据集。该数据集填补了现有V2X数据集中在城市路口的局限性,覆盖100+公里高速公路,包含190万帧多传感器同步数据(5摄像头+2雷达)和1760万个精细标注样本。H-V2X创新性地采用无LiDAR的3D标注流程,并提供高精度矢量地图支持。论文定义了BEV检测、统一ID跟踪和轨迹预测三大任务,并提出了融合HDMap的创新baseline方法。
2025-12-16 00:57:17
888
原创 (论文速读)Nickel and Diming Your GAN:通过知识蒸馏提高GAN效率的双重方法
提出两种互补方法DiME和NICKEL,用于高效压缩生成对抗网络(GAN)。DiME利用预训练基础模型进行分布匹配,NICKEL通过交互式知识交换增强稳定性。实验表明,该方法在极端压缩率(99.69%)下仍能保持生成质量,FID仅29.38,显著优于现有技术。该研究为资源受限环境部署高质量GAN提供了有效解决方案。
2025-12-15 00:26:29
2304
1
原创 (训练自己的数据集指南)ECCV2024:Nickel and Diming Your GAN:通过知识蒸馏提高GAN效率的双重方法
(训练自己的数据集)ECCV2024:Nickel and Diming Your GAN:通过知识蒸馏提高GAN效率的双重方法
2025-12-15 00:25:31
245
2
原创 (论文速读)基于YCrCb-MST高光谱重建的太阳镜片颜色分类系统
针对太阳镜镜片颜色分类难题,研究提出基于YCrCb-MST高光谱重建的智能分类系统。该系统通过LED点光源采集反射光图像,采用YCrCb多级光谱转换器将RGB图像重建为31通道高光谱图像,结合粒子群优化的极限学习机(PSO-ELM)进行分类。实验结果显示,系统在蓝绿色镜片分类中达到98.69±0.59%的准确率,显著优于传统方法。该方案以低成本RGB相机实现高精度光谱分类,为工业生产提供了可行的技术解决方案,并在医学影像、遥感监测等领域具有广泛应用潜力。
2025-12-13 13:19:11
733
原创 (论文速读)基于高斯混合模型的变温环境下裂纹损伤定量评价
一种基于高斯混合模型(GMM)的变温环境下疲劳裂纹定量检测方法。针对高速列车铝合金车体在极端温度变化(-40°C至85°C)中的裂纹监测难题,研究建立了包含7个物理意义明确的损伤指标体系,采用主成分分析降维后构建GMM数据库。通过最大相似度准则实现温度匹配,建立裂纹长度定量模型。实验验证表明,该方法在预设温度和任意温度下的裂纹检测相对误差分别控制在8%和10%以内,为变温环境下的结构健康监测提供了有效解决方案。
2025-12-13 13:18:44
1010
原创 (论文速读)基于双目视觉的林草火灾检测与测距
一种基于双目视觉的林草火灾检测与测距方法,融合YOLOv5目标检测与改进的3层SGBM立体匹配算法,实现火灾目标的精准识别与定位。通过多尺度优化和正三角形距离计算方法,显著提高测距精度。实验结果表明,该方法相对定位误差可控制在2%以内,具有较高的可靠性和实用价值,为林草火灾监测预警提供了有效的技术手段。
2025-12-12 13:56:10
884
空空如也
YOLOX在训练过程中,如果路径的用户名存在空格,报错了怎么办?(Pytorch)
2024-06-15
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅