
CV
文章平均质量分 89
想太多!
点个赞关注一波再走呗!QWQ
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
计算机视觉——day88 读论文:基于驾驶员注意视野的交通目标检测与识别
该方法使用由前视立体成像系统和非接触式三维凝视跟踪器联合交叉校准获得的注视点的驱动器三维绝对坐标。在检测阶段,结合了多尺度HOG-SVM和Faster r - cnn模型。识别阶段通过ResNet-101网络来验证生成的假设集。我们将这种方法应用于城市环境中驾驶过程中收集到的真实数据。原创 2023-05-02 10:04:12 · 2090 阅读 · 1 评论 -
计算机视觉——yolov5回归与跨网格预测、训练技巧(下篇)
3. YOLOv5目标框回归与跨网格预测策略3.1 回顾:目标框PASCAL VOC标注格式3.2 标记文件一个例子3.3 目标框回归3.4 YOLOv5跨网格匹配策略4. YOLOv5 训练技巧4.1 训练预热warmup4.2 自动计算锚框4.3 超参数进化4.4 自动混合精度训练4.5 断点续训 !!!!!!!!!4.6 多GPU训练4.7 并行数据加载原创 2023-04-19 10:23:54 · 2614 阅读 · 0 评论 -
计算机视觉——yolov5网络架构、组件和损失函数(上篇)
1. yolov5网络架构与组件1.1 网络可视化工具 netron1.2 不同模型的配置1.3 Focus 模块1.4 CSPNet 跨阶段局部网络1.5 SPP 空间金字塔池化1.6 PANet 路径聚合网络image-202303301306037432. 损失函数2.1 类别预测2.2 边界框回归2.3 回顾IoU2.4 IoU推广——GIoU loss2.5 IoU推广——DIoU loss2.6 IoU推广——CIoU loss2.7 总结原创 2023-03-30 13:46:54 · 992 阅读 · 0 评论 -
CV——day85 注意力机制经典之作——Attention Is All You Need
注意函数可以描述为将查询和一组键值对映射到输出,其中查询、键、值和输出都是向量。输出是作为值的加权和计算的,其中分配给每个值的权重是通过查询与相应键的兼容性函数计算的。原创 2023-03-19 09:58:46 · 330 阅读 · 0 评论 -
CV——day84 多尺度变形注意与多层特征聚合遥感目标检测
在本文中,我们提出了一种MSDAM和一种MLFAM,并将它们插入FPN中,以提高不同形状和大小的遥感目标的检测性能。在DIOR和RSOD数据集上进行的大量实验表明,本文提出的方法在检测精度方面优于目前最先进的基线方法。原创 2023-03-18 11:00:45 · 1694 阅读 · 0 评论 -
CV——dy83 接昨天的论文中DAM模块:压缩-激励的宽残差网络在图像分类中的应用
SeNets的目的是通过明确地建模其卷积特征的信道之间的相互依赖关系来提高网络的表示能力。全局协方差池描述了特征通道之间的相关性。本文提出了利用信道信息的SE-WRNs-GVP。为了避免SE-blocks造成的信息丢失,提出了一种rSE-blocks。我们的rSE-WRN-26-10-GVP对CIFAR10的错误率为3.79%,对CIFAR100的错误率为20.44%,低于WRN。在加入全局协方差池时,学习速率衰减和带有dropout的SE-blocks对解决过拟合问题至关重要。信道信息的有效利用将提高原创 2023-03-05 11:10:33 · 872 阅读 · 0 评论 -
CV——day82 读论文:遥感目标检测的改进注意力特征融合SSD (AF-SSD)方法
本文提出了一种单阶段遥感目标探测模型,我们称之为AF-SSD。为了解决物体小、背景复杂和尺度变化带来的问题,我们首先引入自顶向下的FFM融合浅层和上层的特征。然后,引入一个DAM来抑制背景噪声。然后,设计了一个MRF模块来扩大接收域和捕获多尺度特征。此外,我们对损失函数进行了改进,以缓解正、负样本之间的不平衡。在DOTA和NWPU VHR-10上的实验结果表明,该方法对航拍图像中的小目标具有较好的检测效果。原创 2023-03-05 00:12:35 · 2155 阅读 · 0 评论 -
CV——day81(1) 读论文: 基于自监督一致性学习的驾驶场景交通事故检测(有源码)
本文吸收了前人的帧预测和位置预测的优点,提出了一种通过学习连续帧内外观、运动和上下文关系一致性的交通事故检测方法,并采用生成式和对抗性训练策略的多任务一致性学习框架来实现。我们还设计了一种融合外观、运动和上下文一致性测量的新策略。基于我们之前收集的两个具有挑战性的数据集,即AnAn交通事故检测(A3D)和DADA-2000的广泛实验。通过与几种最新方法的比较,验证了该方法的优越性。此外,在我们的DADA-2000数据集上,我们分析了每种方法在不同交通事故行为类型、不同事故类别以及涉及或不涉及自我车的情况下的原创 2023-03-02 13:23:05 · 945 阅读 · 2 评论 -
CV——day80 读论文:DLT-Net:可行驶区域、车道线和交通对象的联合检测
本文提出了一种可行驶区域、车道线和交通目标联合检测的统一网络DLT-Net。这三个任务被认为是自动驾驶汽车最关键的感知任务。该网络在BDD数据集的所有三个任务中都显示出竞争性能。在DLT-Net中设计的上下文张量显著提高了检测精度,使其性能优于多项网络。考虑到智能交通应用的性质,与将每个任务分开相比,统一网络具有固有的优势。此外,与分离每个解码器相比,上下文张量结构在提高检测精度方面显示出固有的优势。原创 2023-03-01 12:41:26 · 1268 阅读 · 0 评论 -
CV——day79 读论文:基于小目标检测的扩展特征金字塔网络
在本文中,我们提出了一种扩展的金字塔网络来解决小目标检测的问题,它是由类似fpn的框架生成一个专门针对小目标的层。在类fpn框架中嵌入一种新的特征纹理传递模块,通过基于参考的特征级SR有效地捕获扩展金字塔级的更多区域细节。此外,我们引入交叉分辨率蒸馏机制来提高SR特征的质量,其中我们设计了前景-背景-平衡的训练损耗来缓解前景和背景的区域不平衡。在各种数据集上的最新性能表明了EFPN在小目标检测方面的优越性。原创 2023-02-26 10:35:57 · 1806 阅读 · 0 评论 -
CV——day78 读论文:通过静态背景构建扩展低通道路边雷达的探测距离(目标是规避风险)
在本文中,我们提出了一种扩展路边激光雷达探测范围的方法。首先,构造一个静态背景作为漏斗来过滤背景点。在静态背景构建中,利用多帧点云数据覆盖激光雷达传感器的最大水平角和垂直角,最终获得背景信息。此外,对静态背景进行优化,以减少远距离背景点的缺失和噪声点的出现。与其他方法相比,本文提出的方法可以用较少的点云数据构造出更精确的静态背景。原创 2023-02-25 15:58:39 · 627 阅读 · 0 评论 -
CV——day77 简读论文:视频中交通标志的跟踪检测
随着先进的驾驶员辅助系统或自动驾驶应用的出现,从安装在汽车上的摄像机检测和识别道路标志的问题正获得越来越多的关注。在这篇论文中,我们尝试在单一影像物件侦测器的基础上改善侦测效能。我们已研究了可纳入该制度的各种措施。我们研究并实现了Tractor-based、基于IOU的方法、DFF、FGFA和SELSA。我们也提出一个架构,作为一个后处理程序,基于Faster R-CNN的两阶段目标检测器。原创 2023-02-14 10:36:23 · 685 阅读 · 0 评论 -
CV——day76 读论文:BBC Net:遮挡鲁棒目标检测的边界盒临界网络
本文提出了一种新的考虑遮挡区域的目标检测训练框架。在提出的方法中,我们设计了边界盒(BB)估计器,用于以BB图的形式预测目标区域和遮挡区域。BB估计器估计输入图像的对象和遮挡特性。我们建立了高层和低层BB估计器来估计BB图。从而诱导特征编码网络对物体的区别特征和遮挡特征进行编码。原创 2023-02-12 10:56:51 · 668 阅读 · 1 评论 -
CV——day75 读论文:基于差分特征融合CNN的轨道交通目标检测
为了预防铁路调车事故的发生,提出了一种基于DFF-Net的铁路交通目标实时检测系统。为了提高网络的精度和实时性,我们在DFF-Net中引入了两个新的部分:优先目标检测模块和目标检测模块。首先,在前对象检测模块生成用于下一模块的在前锚框。目标检测模块利用已有的锚盒作为输入,通过特征融合子模块丰富语义信息,从而实现目标的准确检测。原创 2023-02-11 19:20:13 · 978 阅读 · 3 评论 -
CV——day74 读论文:关注前景的anchor-free交通场景探测器
综上所述,为了提高无锚点检测器在交通目标检测中的性能,提出了FII-CenterNet算法,该算法引入前景信息以消除交通场景中复杂背景信息的干扰。前景区域建议网络基于语义分割,其由从边界框标签生成的分割标签监督。引入中景作为前景与背景的过渡,可以提供丰富的目标边缘信息。由于引入了前景位置和尺度信息,有效地提高了检测精度,在KITTI验证集上的实验结果验证了这一点。KITTI基准测试和PASCAL VOC 2007测试结果表明,FII-CenterNet在准确性和效率方面都达到了最先进的水平。原创 2023-02-10 16:45:41 · 807 阅读 · 0 评论 -
CV——day73 读论文:交通场景下基于注意力特征融合的小目标检测
目标检测算法的高精度和快速实时性对于自主车辆的安全性和实时控制具有重要意义。针对自动驾驶系统,提出了一种基于注意力特征融合的交通场景小目标检测方法,作为YOLOv 5s架构的改进。为了在局部和全局尺度上聚合有效信息,MS-CAB同时关注分布在局部范围内的小对象和分布在全局范围内的大对象。利用AFFB融合来自不同网络层的上下文信息,得到参数少、精度高的模型。在满足车辆环境感知系统实时性要求的情况下,与基准车型YOLOv 5s相比,本文提出的模型将交通场景数据集BDD100K验证集上所有对象的mAP提高原创 2023-02-09 10:26:42 · 1107 阅读 · 0 评论 -
CV——day72:从零开始学YOLO——YOLO-v3(可以在我的资源里下载完整的v1到v3的笔记啦!)
tips:作者本人因为美军广泛运用于军事领域,所以决定不再继续开发YOLO系列。但是其他人还是继续往后做了~v8都有了原创 2023-01-31 10:44:34 · 438 阅读 · 0 评论 -
CV——day71 零基础学YOLO:YOLOv2
YOLO-V2-Batch Normalization a. V2版本舍弃**Dropout**,卷积后全部加入**Batch Normalization** b. 网络的每一层的输入都做了归一化,收敛相对更容易 c. 经过Batch Normalization处理后的网络会提升2%的mAP d. 从现在的角度来看,Batch Normalization已经成网络必备处理原创 2023-01-30 11:56:11 · 453 阅读 · 0 评论 -
CV——day70 零基础学YOLO:YOLOv1
检测任务分为两种类型:单阶段检测算法:YOLO系列最核心的优势:速度非常快,适合做实时检测任务! 但是缺点也是有的,效果通常情况下不会太好!二阶段检测算法:Faster-RCNN,MASK-RCNN速度通常较慢(5FPS),但是效果通常还是不错的!原创 2023-01-28 10:27:09 · 643 阅读 · 0 评论 -
CV——day69:YOLO9000: Better, Faster, Stronger(已完结)
YOLO9000是一个通过联合优化检测和分类来检测9000多个对象类别的实时框架。我们使用WordTree联合收割机来自不同来源的数据,并使用联合优化技术在ImageNet和COCO上同时进行训练。YOLO9000是缩小检测和分类之间数据集大小差距的有力一步原创 2023-01-25 10:40:35 · 1063 阅读 · 0 评论 -
计算机视觉——day68:YOLO9000: Better, Faster, Stronger(未完结)
YOLO9000是一个通过联合优化检测和分类来检测9000多个对象类别的实时框架。我们使用WordTree联合收割机来自不同来源的数据,并使用联合优化技术在ImageNet和COCO上同时进行训练。YOLO9000是缩小检测和分类之间数据集大小差距的有力一步原创 2023-01-23 10:21:38 · 761 阅读 · 0 评论 -
目标检测——day66 Scaled-YOLOv4: Scaling Cross Stage Partial Network
基于CSP方法的YOLOV4目标检测神经网络具有上下可伸缩性,适用于小型网络和大型网络。 因此,我们使用TensorRT-FP16在Test-Dev COCO数据集上实现了Yolov4大模型的最高精度56.0%AP,在RTX 2080TI上实现了Yolov4小模型的极高速度1774 fps,在其他Yolov4模型上实现了最佳速度和精度。原创 2023-01-17 11:58:36 · 1082 阅读 · 0 评论 -
R-P-Faster R-CNN day65 读论文:高分辨率遥感影像综合地理空间目标检测框架
提出了一种基于FASTER区域卷积神经网络(FASTER R-CNN)的高效、鲁棒的综合地理空间目标检测框架。 * 这篇文章有不少之前已经学过或了解了的基础知识,所以咱们直接跳过繁杂的实验和介绍,直捣黄龙看看框架是什么样的,记住Keywords:**High Spatial Resolution**、 **Remote Sensing Image**、**FASTER R-CNN*** 这篇文章对**Faster R-CNN**有一个较为详细的解释原创 2023-01-16 10:05:12 · 629 阅读 · 0 评论 -
任意方向边界框——day64 读论文:基于自适应目标定位特征卷积神经网络的高分辨率遥感影像多面向目标检测
针对HSRIS目标检测中目标定位的多角度特征,提出了一种基于自适应目标定位特征卷积神经网络(CNN-AOF)的HSRIS目标检测方法。**首先**,提出了一种自适应的目标定位回归方法,以获得任意方向上的目标区域。 **然后**,利用自适应目标定向回归方法设计了一个用于HSRIS目标检测的CNN框架。 为了验证CNN-AOF的目标检测有效性,本文采用WHU-RSONE-OBB、UCAS-AOD、HSRC2016和DOTA数据集对CNN-AOF和一些现有的目标检测算法进行了定性和定量的比较。 *原创 2023-01-14 10:25:27 · 972 阅读 · 0 评论 -
目标检测、谓词组合网络检测和显著性检测——day62 读论文: Multi-task Compositional Network for Visual Relationship Detection
在本文中,我们将视觉关系检测视为目标检测、显著性检测和谓词检测这三个相关子任务的组成部分。我们提出了一种新的视觉关系检测网络,即mcn,它深度结合了目标检测、谓词检测和显著性检测。MCN由连接的三个模块组成,一个用来检测对象的对象检测器,一个关系产生器来产生确定关系和不确定关系的关系,以及一个关系预测器来决定显著性得分和预测谓词。原创 2023-01-12 18:27:47 · 1050 阅读 · 0 评论 -
可信度分析——day61 读论文: 目标检测模型的决策依据与可信度分析
在用 LIME 直接对目标检测模型进行解释时, 发现局部线性回归模型的忠诚度与权重值过小这两个问题. 我们通过实验分析, 揭示了目标检测模型在预测时关注物体整体这一性质, 并将问题的原因定位在图像分割方法不合理. 本文通过将图像分割方法替换为语义分割模型 DeepLab, 并对解释内容作出定义, 成功解决 LIME 存在的问题, 并将其应用于解释目标检测模型. 通过实验证明, 采用 DeepLab+LIME, 可以得到可信度较高且直观的决策依据分析结果.另一方面, 基于 IoU、模型解释结果、基准原创 2023-01-11 10:27:48 · 1053 阅读 · 0 评论 -
目标检测——day60 Object Detection Using Deep Learning Methods in Traffic Scenarios(待更新)
提出了目标检测在交通场景的应用,在介绍深度模型对目标检测带来的提升后,详解目标检测对自动驾驶的安全性等提升,得出结论:目标检测在交通场景中扮演重要的角色。根据不同目标对象汇总数据集(Table 2)原创 2022-12-11 11:40:02 · 413 阅读 · 0 评论 -
Swin Transformer目标检测实验——测试自己的数据集
随着第二步的完成,竟然奇迹般的解决了0.0,这个用词只是说明了自己没搞懂这背后的原理,但是有些程序不就是bug运行的嘛(狗头),所以,最后想想应该就是batch size设置的问题,还有就是不要边安装软件边训练模型。如果我哪天搞懂了,会持续更新的(应该),有不懂的可以留言或私信,不定时回复,作者也在摸索中,希望大家一起进步呀!原创 2022-11-28 13:25:12 · 2528 阅读 · 0 评论 -
Swin Transformer目标检测实验——环境配置的步骤和避坑
对应的Cudnn版本自己对着找一下,帖子里有写!Cuda版本要小于等于第一个红框中的版本哦!在实验的最开始,博主并没有强调一些点,而又是很重要的内容,接下来我给大家排一下坑!大家是不是都从b站来的呀,先给你们基础环境的配置和搭配的视频教程。原创 2022-11-25 09:38:51 · 1720 阅读 · 6 评论 -
目标检测——day56 Unmixing_Convolutional_Features_for_Crisp_Edge_Detection(用于清晰边缘探测的卷积特征分解)
本文提出了一种简单有效的上下文感知跟踪策略(CATS),以解决现代深度边缘检测器定位模糊的问题。 CATS通过在融合过程中将边缘特征与跟踪丢失和侧边预测与共融合块混合来解决这个问题。原创 2022-11-08 11:05:01 · 954 阅读 · 0 评论 -
目标检测——day55 Feature Split–Merge–Enhancement Network for Remote Sensing Object Detection
本文提出了一种提高遥感图像多尺度目标检测性能的特征小企业网络。在多个数据集上的实验验证了我们所提出的模块的有效性。FSM模块减轻了多尺度对象之间的特性混淆。OER模块使模型对多层特征图之间的特征空间布局的不一致性具有更强的鲁棒性。OSE策略增强了显著特征,抑制了背景信息。但是,我们的模块的内部设计比较繁琐,所以计算复杂度相对较高。此外,我们使用水平边界框来勾画出检测到的对象,这些对象不够优雅。在不久的将来,我们将在保持精度的同时定制网络,设计一个更简单、更通用的模块结构,并更准确地校准目标,使其更适合遥感目原创 2022-11-04 12:30:40 · 1163 阅读 · 0 评论 -
对抗性补丁——day54(second)Towards-a-physical-world-adversarial-patch-for-blinding object detection models
在这项工作中,我们成功地攻击了YOLOv3和更快的r-cnn,这是两种最先进的对象检测模型。我们的对抗性攻击是通过在原始图像中添加对抗性补丁来执行的。我们提出了一种对抗性攻击框架,该框架可以为特定类别的对象生成对抗性补丁。我们通过最小化精心设计的检测分数来抑制检测模型对目标对象的推断。我们的攻击可以成功隐藏目标对象类 “人” 或对象检测模型中的任何类。原创 2022-11-03 17:44:12 · 1670 阅读 · 1 评论 -
目标检测——day 53 Concealed Object Detection
隐蔽物体检测系统在医学,艺术和农业等领域具有各种下游应用。在这里,由于这些应用程序的共同特征,我们设想了一些潜在的用途,其中目标对象与背景具有相似的外观。在这种情况下,COD模型非常适合充当这些应用程序的核心组件,以挖掘伪装的物体。请注意,这些应用程序只是玩具示例,可以为将来的研究激发有趣的想法。原创 2022-11-02 13:52:23 · 628 阅读 · 0 评论 -
多尺度深度学习——day52 基于领导者的多尺度注意力深度人物再识别架构
在本文中,受人类认知过程的启发,我们提出了一种新的深层结构——MuDeep。与以前的re-id方法不同,MuDeep利用了从多个尺度中提取的人的特征。此外,还提出了一种新的基于领导者的注意学习层,利用所有信息作为领导者,动态地指导每个特定规模数据流的重要区域的分析。在几个基准测试上的大量实验表明,我们的模型达到了最先进的性能。最后,我们考虑了一个更现实的域泛化设置。我们表明,在这种设置下,我们的模型比最先进的替代方案的优势甚至更加明显。这表明,使用MuDeep提取的多尺度特征更适用于新的领域。原创 2022-11-01 19:53:33 · 677 阅读 · 0 评论 -
目标检测——day51 Weakly Supervised Object Detection Using Proposal- and Semantic-Level Relationships
本文提出了一种新的弱监督目标检测方法,该方法分别利用建议级关系和语义级关系来帮助推理所期望的目标位置和语义存在性。原创 2022-10-31 16:06:14 · 484 阅读 · 3 评论 -
轨迹预测——day50 基于多头注意力对抗机制的复杂场景行人轨迹预测
一种基于多头注意力机制的生成对抗网络模型图 2 为 MAGAM 模型 的整体框架 模型采用生成对抗网络结构包括一个生成器和一个判别器 。生成器以行人的观测轨迹序列 T作为输入 ,学习各行 人之间 的复杂交互关系 并生成 预测 轨 迹 判别 器T^。学习判断某 一 轨迹是真实轨迹还是由生成器生成的轨迹 。其中本模块对每个行人的历史轨迹迸行编码,利用 LSTM 对每个行人的历史轨迹序列进行建模,得到当前时刻的状态本填块旨在利甩多头注意力机制深度捕捉行人之间 的交互模式。图3描述了利用多头注意力机制提取行人交互原创 2022-10-30 10:57:58 · 1507 阅读 · 5 评论 -
计算机视觉——day48 方向集中学习:增强机器学习中的一致性
在这项工作中,我们将一致性定义为在学习过程中新信息和学习知识之间的一致性。我们提出了一种方向集中学习(DCL)方法来考虑学习过程中的一致性来寻找局部最小值。我们研究了显著性预测、持续学习和分类三个任务的一致性。所提出的DCL方法通常提高了这三个任务的性能。更重要的是,我们的分析表明,所提出的DCL方法改善了灾难性遗忘。原创 2022-10-28 16:21:37 · 1402 阅读 · 0 评论 -
目标检测——day45 深度区域集:用于通用对象检测的混合表示和深度学习
此外,拟议的系统可以以完全终端的方式进行培训,而不需要额外的努力。,显示了从一个投影变换和一个仿射变换初始化的示例.3个单元中的其他8个以类似的方式初始化,希望从选定区域中提取regionlet,以更好地表示具有可变形状和可变形零件的对象。sigmoid分别生成相应的权重,最终的特征表示由特征图的乘积 V及其对应的权重生成。,当以非常高的密度水平学习区域时,可能会学习一些冗余的空间信息,而不会对检测有用,从而影响要做出的基于区域提案的决策。我们的方法通过使用门控网络以柔和的方式执行精细的特征选择和池化。原创 2022-10-26 13:27:26 · 637 阅读 · 0 评论 -
目标检测——day46 可转移交互性知识的人机交互检测
在本文中,我们提出了一种新的方法来学习和利用内隐互动知识,这是通用的和超越相关性的范畴。因此,它可以跨数据集进行传输。我们提出了一个层次交互范式来采用实例和部分级交互。并进一步探索了一个一致性学习任务来提高学习能力。利用交互知识,我们利用交互网络在推理HOI分类之前进行非交互抑制。大量的实验结果表明,学习到的交互性知识的效率。通过将我们的方法与现有的检测模型相结合,我们实现了在HOI检测任务上的最先进的结果。原创 2022-10-21 17:42:15 · 1157 阅读 · 0 评论 -
目标检测——day46 利用单线程快速显著目标检测的深度非局部模型
本文介绍了一种新颖的DNL模块,该模块有效地提高了IR模块的精度。提出了DNL的分而治之变体,以进一步加速推理。此外,我们开发了一种基于DNL的轻量级网络体系结构,具有低内存成本,高推理速度和具有竞争力的准确性。数值结果表明,在基于深度CNN的方法中,我们的方法不仅实现了竞争精度,而且实现了最先进的效率。原创 2022-10-20 11:45:13 · 866 阅读 · 1 评论