- 博客(20)
- 收藏
- 关注
原创 【论文阅读】Railway rutting defects detection based on improved RT‑DETR
铁路道岔是轨道系统的关键部件,其缺陷会导致严重的安全事故和重大的财产损失。铁路道岔缺陷分布不均匀、大小不一,再加上环境照明的变化和复杂的背景,对传统的检测方法提出了挑战,往往导致检测精度低、实时性差。针对提高道岔缺陷检测性能的问题,提出了一种基于RT-DETR体系结构的高精度识别模型FRICH-HILO-BiFPN-DETR(FHB-DETR)。首先,设计了基于FASTER BLOCK的faster CGLU模块,通过局部卷积和门控机制优化了局部和全局特征信息的聚合。
2025-09-24 09:35:52
1172
原创 【论文阅读】An efficient transformer network for detecting multi-scale chicken in complex free-range.....
复杂环境下鸡的准确目标检测和定位是实现智能散养鸡养殖的基础。然而,商业化的散养鸡养殖对检测方法提出了一些挑战,包括复杂多变的背景、多尺度目标、聚集遮挡和鸡的姿态变化。虽然基于卷积神经网络的目标检测算法已经有了大量的研究,但这些算法在检测小目标和推广到新场景方面的有效性有限。因此,本研究提出了一种基于改进的实时检测变压器(RT-DETR)的高效多尺度鸡肉目标检测模型(EMSC-DETR),该模型具有较高的准确性和较强的泛化能力。为了解决小目标特征容易丢失。
2025-09-12 16:54:47
685
原创 【论文阅读】Enhanced real-time detection transformer (RT-DETR) for robotic inspection of underwater bridge
视觉环境的不足降低了水下桥墩断裂检测的准确性。因此,本文建议改进RT-DETR模型的主干,作为YOLOv8模型的主干。这将通过用PKI模块取代C2F模块来实现,该模块由PKI模块和上下文锚定注意(CAA)块组成。它具有很强的区分裂缝和背景特征的能力,能够对水下桥墩裂缝进行准确识别。为了提供检测这些裂缝的数据,改进CycleGAN网络将陆上类型的桥梁裂缝图像转换为水下类型的断裂图像。该模型的F1得分为0.85,MAP50为0.84。
2025-09-11 14:06:02
837
原创 【论文阅读】FedsNet: the real‑time network for pedestrian detection based on RT‑DETR
针对行人检测中模型网络复杂、检测精度低、小目标检测容易误检和漏检等问题,提出了一种基于RT-DETR的行人检测网络FedsNet。通过构建一个新的轻量级骨干网络ResFastNet,减少了模型的参数数量和计算量,加快了行人检测的速度。将高效的多尺度注意(EMA)机制与主干网络相结合,创建了一个新的ResBlock模块,用于改进对小目标的检测。采用更有效的DySample作为上采样算子,提高了行人检测的准确性和稳健性。采用SIOU作为损失函数,提高了行人识别的准确率,加快了模型的收敛速度。
2025-09-05 14:50:10
885
原创 【论文阅读】Bearing-DETR: A Lightweight Deep Learning Model for Bearing Defect Detection Based on RT-DETR
准确、高效地检测轴承缺陷对工业安全和生产效率至关重要。本文介绍了一种利用RT-DETR结构优化的深度学习模型–Bearing-DETR。通过DySample动态上采样、使用Meta-Mobile模块(MMB)的高效模型优化(EMO)和可变形大内核注意(D-LKA),Bearing-DETR在缺陷检测方面提供了显著改进,同时保持了适用于低资源设备的轻量级框架。
2025-09-04 14:07:41
882
原创 【论文阅读】Object Detection in Adverse Weather for Autonomous Driving through Data Merging and YOLOv8
对于自动驾驶来说,感知是一个主要和必要的元素,它从根本上处理通过传感器对自我车辆环境的洞察。感知是具有挑战性的,它受制于动态的对象和持续的环境变化。由于雪、雨、雾、夜光、沙尘暴、强光等不利天气干扰了感知质量,导致问题变得更加严重。在本工作中,我们试图提高基于摄像头的感知精度,例如在不利天气下与自动驾驶相关的目标检测。提出了基于YOLOv8的恶劣天气环境下目标检测的改进方法,利用融合后的各种恶劣天气数据进行迁移学习。
2025-08-28 16:12:23
1142
原创 【论文阅读】Small-object detection based on YOLOv5 in autonomous driving systems
随着自动驾驶领域的快速发展,对更快、更准确的目标检测框架的需求已经成为必要。最近的许多基于深度学习的目标检测器在各种实时驾驶应用中表现出了令人信服的性能,用于检测大型目标。然而,由于交通标志和交通灯等小目标的复杂性质,检测这些目标是一项具有挑战性的任务。此外,由于存在前景/背景不平衡以及恶劣天气和低光照条件导致的透视失真,少数图像中存在的复杂性进一步使得精确检测小目标变得困难。在这封信中,我们调查了如何调整现有的物体探测器以满足特定任务,以及这些修改如何影响对小物体的检测。
2025-08-27 17:10:08
1088
原创 【论文阅读】Fast and accurate object detector for autonomous driving based on improved YOLOv5
自动驾驶是人工智能的一个重要分支,实时准确的目标检测是保证自动驾驶车辆安全稳定运行的关键。为此,本文提出了一种基于改进的YOLOv5的快速准确的自动驾驶目标检测器。首先,对YOLOv5算法进行了改进,引入结构重参数(REP),通过训练-推理解耦提高了模型的精度和速度。此外,在训练阶段引入了神经架构搜索法对多分支再参数化模块中的冗余分支进行裁剪,提高了训练的效率和精度。最后,在网络中加入小目标检测层,并在各检测层加入协调注意机制,以提高模型对小型车辆和行人的识别率。
2025-08-27 15:45:22
971
原创 【论文阅读】Lightweight tomato ripeness detection algorithm based on the improved RT-DETR
番茄具有很高的营养价值,需要对成熟果实进行准确的成熟度鉴定和选择性采收,以显著提高番茄收获管理的效率和经济效益。以往对番茄智能收获的研究往往只以番茄为目标,缺乏对番茄成熟度的细粒度检测。这一缺陷导致了未成熟腐烂水果的不慎收获,造成经济损失。此外,在自然环境中,光照不均匀、叶片遮挡和果实重叠阻碍了机器人系统对番茄成熟度的准确评估。同时,番茄成熟度检测中对高精度和快速响应的要求与使模型轻量化以降低硬件成本的需要相结合。为了应对这些挑战,本研究提出了一个轻量级模型PDSI-RTDETR。首先,
2025-08-25 15:45:18
714
原创 【论文阅读】Multi-Scale Fusion Uncrewed Aerial Vehicle Detection Based on RT-DETR
随着科学技术的快速发展,无人机技术在各个领域显示出广阔的应用前景。无人机目标检测的准确性和实时性对于确保无人机的安全和提高其工作效率至关重要。针对当前无人机探测领域面临的挑战,本文提出了聚合级联扩展DETR(GCD-DETR)模型,旨在提高无人机目标探测的准确性和效率。本文的主要创新点如下:(1)将扩展重参数块创新地应用于扩展方向残差模块,该模块将大核卷积和并行小核卷积结合在一起,融合了多尺度感知生成的特征图,大大提高了特征提取能力,从而提高了无人机检测的准确性。
2025-08-22 11:12:43
660
原创 【论文阅读】Drone-DETR: Efficient Small Object Detection for Remote Sensing Image Using Enhanced RT-DETR
低延迟、高精度的目标检测对配备视觉传感器的无人机 (UAV)具有重要意义。然而,目前嵌入式无人机设备的局限性导致其在检测精度和速度的平衡方面提出了挑战,特别是在高精度遥感图像分析中。这一挑战在涉及许多小物体、复杂背景和遮挡重叠的场景中尤为明显。为了解决这些问题,我们引入了基于 RT-DETR 的 Drone-DETR 模型。为了克服与检测小物体和减少超广角图像中复杂背景产生的冗余计算相关的困难,我们提出了有效的小目标检测网络(ESDNet)。
2025-08-21 14:45:06
1070
原创 【3D视觉】PointNet论文阅读
点云是一种重要的几何数据结构。由于其格式不规则,大多数研究人员会将此类数据转换为规则的三维体素网格或图像集合。然而,这会导致数据量过大并引发问题。本文设计了一种新型神经网络,它直接处理点云数据,并很好地保留了输入点的置换不变性。PointNet 网络为对象分类、部件分割和场景语义解析等应用提供了统一的架构。PointNet 虽然简单,但却高效且有效。经验表明,它的性能与当前最佳技术相当甚至更好。从理论上讲,我们分析了该网络学到了什么,以及为什么它能够抵御输入扰动和损坏。
2025-05-07 16:45:52
1208
1
原创 【常用知识】word参考文献连续引用
word参考文献引用1、选中参考文献->自动编号(可根据需要自定义编号格式)2、在需要引用的地方,引用->交叉引用多个参考文献连续引用一、如果是两篇文献,如“限制了其在资源受限环境下的应用,如自动驾驶、辅助医疗和移动设备等[1,2]”1、按照上述步骤引用两个参考文献2、选中[1][2],右击切换域代码结果为:3、在下图所示位置分别加入【#“[0” 】、【#“0]” 】,并在两个{}中间加入逗号结果变成下图:4、选中域代码,右击更新域得到结果:二、如果是多
2024-10-15 17:16:39
4361
原创 语义分割论文阅读笔记7:DDRNet
语义分割是自动驾驶汽车理解周围场景的关键技术。当代模型的吸引人的性能通常是以繁重的计算和漫长的推理时间为代价的,这对于自动驾驶来说是无法忍受的。最近的方法使用轻量级架构(编码器-解码器或双路径)或对低分辨率图像进行推理,实现了非常快速的场景解析,甚至在单个 1080Ti GPU 上以超过 100 FPS 的速度运行。然而,这些实时方法与基于扩张主干的模型在性能上仍然存在显着差距。为了解决这个问题,我们提出了一系列专门为实时语义分割而设计的高效主干网。
2024-07-30 11:33:32
1222
原创 语义分割论文阅读笔记6
裂缝是桥梁养护的主要目标,准确检测裂缝有助于保证桥梁的安全使用。针对传统图像处理方法难以准确检测裂纹的问题,引入深度学习技术,提出一种基于改进的DeepLabv3+语义分割算法的裂纹检测方法。在网络结构上,DeepLabv3+网络中引入了密集连接的空洞空间金字塔池化模块,使得网络能够获得更密集的像素采样,从而增强网络提取细节特征的能力。在获得较大感受野的同时,网络参数数量与原算法保持一致。采集不同环境条件下的桥梁裂缝图像,建立混凝土桥梁裂缝分割数据集,通过网络的端到端训练得到分割模型。
2024-07-29 17:10:49
1984
原创 语义分割论文阅读笔记5
本文通过改进用于下水道缺陷分割的U-Net架构,提出了一种新颖的语义分割网络PipeUNet。为了增强特征提取能力并解决高级特征和低级特征之间的语义差异,在U-Net的原始跳跃连接之间添加了一个名为FRAM块的新模块。PipeUNet中使用focal loss来解决类别不平衡问题。PipeUNet 通过多个下水道检测系统的数据进行训练和测试。这给下水道管道带来了显着的多样性,并对模型的鲁棒性提出了巨大的挑战。该数据集包含四种典型缺陷,包括裂纹、渗透、接缝偏移和侵入侧向。
2024-07-25 15:43:14
1692
原创 语义分割论文阅读笔记4
目前在自然场景中训练的深度神经网络模型不能很好地迁移和应用于遥感图像语义分割。研究表明,包含模型融合的微调方法可以缓解这种困境。在本文中,我们提供了一种用于改进 U-Net 的方法,并提出了一种结合了 DenseNet、U-Net、扩张卷积和 DeconvNet 优点的端到端深度卷积神经网络(DCNN)。我们在Potsdam正射影像数据集上评估了所提出的方法和模型。与U-Net相比,我们的方法将PA、mPA和mIoU评估指标分别提高了11.1%、14.0%和13.5%;
2024-07-19 09:56:39
853
1
原创 语义分割论文阅读笔记3
针对当前语义分割算法中分割精度低、对象边界分割不准确的问题,提出利用多重损失函数约束和多级级联残差结构的语义分割算法。采用多层级联残差单元来增加网络层感受野的范围。构建并行网络提取不同深度特征信息,然后将不同深度特征信息与编码器输出特征融合,得到多个输出特征,与标签建立多个损失,从而约束模型优化网络。所提出的网络在 Cityscapes 和 CamVid 数据集上进行了评估。实验结果表明,该算法的平均交并比(MIoU)比原始Deeplabv3+算法分别提高了3.07%和3.59%。
2024-07-09 20:44:24
1683
1
原创 语义分割论文阅读笔记2
语义图像分割是一种端到端的分割方法,可以对目标区域进行逐像素分类。作为光学图像中经典的语义分割网络,DeepLabv3+能够实现良好的分割性能。然而,当该网络直接用于极化合成孔径雷达(PolSAR)图像的语义分割时,很难获得理想的分割结果。原因是由于 PolSAR 数据集较小,很容易产生过拟合。在本文中,提出了一种轻量级复值 DeepLabv3+ (L-CV-DeepLabv3+),用于 PolSAR 数据的语义分割。与原来的 DeepLabv3+ 相比,它有两个显着的优势。
2024-07-07 20:18:46
1030
1
原创 语义分割论文阅读笔记1
遥感图像 (RSI) 的语义分割在许多领域都至关重要,因为 RSI 包含不同的景观和不同大小的地理对象,这使得语义分割具有挑战性。本文提出了一种称为自适应特征融合UNet(AFF-UNet)的卷积网络来优化语义分割性能。该模型具有三个关键方面:(1)密集跳跃连接架构和自适应特征融合模块,自适应地权衡不同级别的特征图以实现自适应特征融合,(2)通道注意卷积块,使用定制配置获取不同通道之间的关系,(3)获得不同位置之间关系的空间注意模块。
2024-07-05 17:05:14
1212
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅