- 博客(48)
- 问答 (32)
- 收藏
- 关注
原创 每日文献(八)——Part one
卷积神经网络(CNN)是一种著名的深度学习架构,其灵感来自于生物的自然视觉感知机制。1959年,Hubel & Wiesel等人发现动物视觉皮层中的细胞负责在接受区探测光线。受到这一发现的启发,福岛邦彦于1980年提出了新认知器,这可以被视为CNN的前身。1990年,LeCun et al.[3]发表了建立CNN现代框架的开创性论文,并在[3]中对其进行了改进。他们开发了一种多层人工神经网络,名为LeNet-5,可以对手写数字进行分类。
2025-04-02 15:05:15
1320
原创 每日文献(七)
今天看《Deep Network-Enabled Haze Visibility Enhancement for Visual IoT-Driven Intelligent Transportation Systems》论文地址:https://drive.google.com/file/d/1EktkeJZDcI6AEgCYsYzzIwE9-JxbXxUN/view标题是“物联网驱动的可视智能交通系统的深度网络化雾霾能见度增强”The Internet of Things (IoT) has rece
2025-03-30 10:00:00
1413
原创 每天一篇目标检测文献(六)——Part One
为了理解图像,我们要对图像进行分类和精确定位其中目标的概念和位置,这就是“目标检测”。其中包含许多子任务:人脸检测、行人检测、骨架检测等等。
2025-03-29 10:00:00
1211
原创 YOLOv8中Anchor-Based、Anchor-Free及样本分配策略
本文主要介绍yolov8中的anchor机制与样本分配策略的静态策略和动态策略
2025-03-28 10:00:00
664
原创 目标检测20年(四)——最终章
欢迎各位读者尽情阅读前三篇文献解读。这一篇将会介绍文献的第五部分:目标检测近些年的新技术发展以及第六部分:总结与未来展望。这也是本篇论文解读的最后一篇文章。
2025-03-26 10:00:00
1038
原创 目标检测20年(三)
让检测器变得更快一直是一项具有挑战性的工作。加速技术可以分为“检测流水线”加速、“检测骨干(backbone)”加速和“数值计算”加速三个层次,
2025-03-24 15:17:23
941
原创 目标检测20年(二)
MS-COCO AP不是固定的IoU阈值,而是在0.5到0.95之间多个阈值进行平均,对性能要求更高。过去10年已经有许多知名数据集发布:PASCAL VOC挑战中的VOC2007、VOC2012,ImageNet大规模视觉识别挑战中的ILSVR2014.MS-COCO检测挑战中的Open Images Dataset等。挑战主要有两个任务:1、标准目标检测 2、视觉关系检测,即检测特定关系中的成对对象。标准检测任务的数据集由1910k图像和15440k在600个对象类别上标注的边界框组成。
2025-03-21 20:21:38
1001
原创 目标检测20年(一)
目标检测的目标是开发计算模型和技术,解决这样两个问题:目标是什么?目标在哪里?(其实就是分类和定位)目标检测是实例分割、图像字幕、目标跟踪等视觉任务的基础。深度学习的发展也让目标检测取得了巨大的进步,现在目标检测已经广泛应用于许多现实场景如自动驾驶、机器人视觉和视频监控等。下图展示了过去二十年里与“目标检测”相关刊物的出版:我们可以看到从1998年起刊物出版量逐步提升,2018年后增长幅度明显增加,且直到2021年都在持续增长。
2025-03-19 22:54:41
1162
原创 YOLOv8轻量化改进——Coordinate Attention注意力机制
现在针对YOLOv8的架构改进越来越多,今天尝试引入了Coordinate Attention注意力机制以改进对小目标物体的检测效率。
2025-03-17 15:59:44
636
原创 每天一篇《目标检测》文献(五)
现有yolov8的改进算法较多,但大多模型计算量大,对边缘部署计算设备的硬件要求高。本文提出了一种更快、更轻的船舶检测算法。该算法首先引入CA注意力机制对检测目标进行定位,其次采用DualConv取代普通卷积Conv和C2f模块,减小网络计算量,更好地实现了轻型船舶目标的实时检测。
2025-03-14 10:30:00
858
原创 每天一篇《目标检测》文献(四)
从关注大尺寸特征图和引入Bi-PAN-FPN观点的角度,本工作提高了模型对小目标的检测性能,同时增加了多尺度特征融合获得更好特征工程的概率和时间。这解决了航空图像中小目标易误检和漏检的常见问题优化模型的骨干网络和损失函数。Ghostblock单元和Wise-IoU边界框回归损失被集成以从特征多样性、特征信息长距捕获以及避免几何因素过度惩罚等方面提高模型泛化能力。在提高模型准确性的同时减少模型参数数量。这解决了远程信息损失问题以及预测框平衡问题构建模型的可行性和有效性通过消融实验证明。
2025-03-13 10:30:00
1507
原创 每天一篇《目标检测》文献(三)
为了获取柑橘果实的准确特征信息,实现被遮挡柑橘的准确识别和定位,达到精确采 摘的目的,提出了一种改进的被遮挡柑橘果实识别模型构建。该模型在 YOLOv8 目标检测模 型中引入了 BAM 注意力机制,解决了被遮挡柑橘识别效果较差的问题,并采用支持向量机 (SVM)实例分割模型提取被遮挡柑橘的精确轮廓,实现被遮挡柑橘果实的精确识别。仿真 试验结果表明,与 YOLOv8 目标检测模型相比,该改进定位模型在被遮挡柑橘果实的平均定 位误差和果径误差率分别降低了16.29mm和8.03%。
2025-03-12 10:54:53
1566
原创 每天一篇《目标检测》文献(二)
无人机拍摄影像存在大量分布密集的小目标,针对通用目标检测方法对小目标容易造成漏检和错检的 问题,提出了一种改进 YOLOv8 的无人机航拍图像小目标检测算法。首先,利用高分辨率浅层特征信息具有 较小的感受野和更精细的空间信息特性,改进算法增加小目标物体检测头,采用四个特征检测头提升小目标 检测率。其次,设计构造 ConvSPD 卷积模块和 BiFormer 注意力增强模块的小目标检测模块组改进 YOLOv8 骨干网络,有效增强小目标浅层细节特征信息的捕获能力。
2025-03-11 10:30:41
1193
1
原创 每天一篇《目标检测》文献(一)
针对密集行人检测存在小目标检测精度低、模型复杂的问题,提出一种改进 YOLOv8 的轻量化密集 行人检测方法。引入 DualConv 模块替换原始 Conv 模块,帮助更深的卷积层更有效地提取信息,减少计算 冗余并提高检测精度;通过融合 RepViTBlock 结构和分离与增强注意力机制 SEMA(Separated and Enhancement Attention)改进 C2f,构建 RS-C2f 结构,提升模型的泛化和特征融合能力,并降低参数量;
2025-03-09 14:20:43
846
1
原创 基于SeaShips数据集的yolov8训练教程
之前已经试过在yolov3和faster-rcnn上训练SeaShips数据集,本次在yolov8上进行训练。yolov8的训练有两种方式,一种是在mmdetection框架下下载mmyolo运行,另一种是直接采用ultralytics。本文两种方法都会介绍。
2025-03-07 19:22:15
1251
原创 mmdetection框架下使用yolov3训练Seaships数据集
之前复现的yolov3算法采用的是传统的coco数据集,这里我需要在新的数据集上跑,也就是船舶检测方向的SeaShips数据集,这里给出教程。
2025-02-26 23:32:24
1103
原创 一文带你看懂目标检测!(四万字超全超详细版)
目标检测(Object Detection)的任务是找出图像中所有感兴趣的目标或物体,并确定它们的类别和位置,是计算机视觉领域的核心问题之一。由于各类物体有不同的外观、形状和姿态,加上成像时光照、遮挡等因素的干扰,目标检测一直是计算机视觉领域最具有挑战性的问题。
2025-02-07 16:46:54
936
原创 自动驾驶3D目标检测综述(八)
在这个章节中,我们会对三维目标检测方法进行一个系统的对比和分析,并对自动驾驶三维检测展望未来研究方向。在第一节中,我们对各种各样的三维目标检测方法的检测性能和推理速度进行综合性的分析,比如基于激光雷达的、基于相机的、多模态的方法,在我们多年进一步总结研究其趋势的多种数据集上。在第二节,我们提出了在此领域的未来研究方向。
2025-01-16 19:59:47
1294
原创 自动驾驶3D目标检测综述(七)
本章紧接上一章内容,讲述第九章的内容:在驾驶系统中的3D目标检测。第九章 驾驶系统中的3D目标检测在本章节中,我们将会介绍驾驶系统中3D目标检测存在的一些严重问题。首先第一节,我们会回顾和分析三维目标检测以端到端方式和其他任务如追踪、策略预测、移动规划、定位一同训练的方法。第二节,我们会介绍为三维目标检测和自动驾驶所设计的仿真系统。第三节,我们会深入调查三维目标检测器和安全意识三维目标检测的鲁棒性话题。第四节,我们会回顾协同三维目标检测相关方法。
2025-01-07 20:02:36
884
原创 自动驾驶3D目标检测综述(五)
第七章 时间3D目标检测在这个章节中主要介绍时间三维目标检测方法。基于数据类型,可以将这些方法分成三类:雷达序列检测、流输入的检测和来自视频的检测。在第一节,我们会回顾采用顺序激光雷达扫描的三维目标检测方法。第二节会介绍采用流数据作为输入的检测方法。第三节我们会研究一种来自视频和多模态时间数据的三维目标检测。
2024-12-08 20:40:55
1592
1
原创 LaTex保姆级安装教程
Latex是一种基于TEX的排版系统,大家在写论文的时候经常要使用固定的模板并按照要求进行排版。本文介绍详细的latex安装教程。
2024-11-26 13:00:57
4598
3
原创 自动驾驶3D目标检测综述(四)
前三篇分别介绍了前四章的内容:本篇是第五篇,介绍的是多模态的3D目标检测方法。第五章 多模态的3D目标检测在这个章节,我们主要介绍的是多模态的三维目标检测方法,其主要是融合了多个传感器输入。根据传感器的类型,我们可以这种方法分为三类:激光雷达和相机、雷达以及基于图融合的方法。我们总共会分三个子章节进行阐述,第一节会回顾和分析激光雷达和相机融合的多模态检测方法,包括基于早期融合方法的,中期融合和后期融合的方法;第二节会研究雷达信号的多模态检测方法;第三节会引入高清地图多模态检测方法。
2024-11-25 10:23:22
1661
原创 自动驾驶3D目标检测综述(三)
在这个章节主要介绍一些基于相机的3D目标检测的方法,分别会回顾和分析单目3D目标检测(又分为仅基于图像、深度信息辅助和先验引导的方法)、基于立体图像的3D目标检测和多相机下的3D目标检测方法。
2024-11-22 16:39:54
2229
原创 基于自定义数据集的可视化
之前已经尝试过在基于Kitti数据集上进行代码可视化的操作,现在对自己的数据集进行可视化。对Kitti数据集可视化的操作可以参考这两篇博客。接下来讲解在自己数据集上进行可视化时需要更改的地方。
2024-11-19 13:55:21
899
原创 自动驾驶3D目标检测综述(二)
本章主要介绍基于激光雷达的3D目标检测方法,这也是目前最常使用的方法。主要会介绍一些算法的模型(有基于点的、基于网格的、基于点体素的和基于范围的)。之后学习3D目标检测器的学习目标,有基于锚点(anchor)的框架和无锚点的框架以及基于雷达的3D目标检测的辅助任务。首先下图展示了基于激光雷达的目标检测方法时间序列图:可以看到基于网格(Grid)的方法最早在2015年出现,也就是vote3D;接着是基于点(Point)的方法,即PointRCNN和IPOD;
2024-11-14 20:44:26
2449
2
原创 自动驾驶3D目标检测综述(一)
文章地址:[2206.09474] 3D Object Detection for Autonomous Driving: A Comprehensive Survey (arxiv.org)这篇综述简单易懂,非常合适对自动驾驶和3D目标检测感兴趣的小白阅读,对相关算法进行初步理解。
2024-11-11 12:59:49
2081
原创 Pointpillars代码解读——数据处理
图1.1:Pointpillars网络架构图PointPillars 是一个来自工业界的模型,整体的思想是基于图片的处理框架,直接将点云从俯视图的视角划分为一个个的立方柱体(Pillars),从而构成了伪图片数据,然后再使用2D检测框架进行特征提取和预测得到检测框,从而使得该模型在速度和精度都达到了一个很好的平衡。PointPillars 的网络结构如图1.1所示。
2024-10-28 14:58:53
1509
1
原创 MMdetection3D配置文件系统
MMdetection3D和其他OpenMMlab仓库使用MMEngine的配置文件系统。它具有模块化和继承性设计,以便于进行各种实验。前面已经对Pointpillars进行复现和理解、对MMdetection3D框架进行解读,现在开始学习MMDetection3D配置文件。
2024-10-24 14:40:37
1357
原创 mmdetection3d模型框架解读
由于 3D 本身数据的复杂性和 MMDetection3D 支持任务(点云 3D 检测、单目 3D 检测、多模态 3D 检测和点云 3D 语义分割等)和场景(室内和室外)的多样性,整个框架结构相对复杂,新人用户的上手门槛相对较高。所以我们推出新的系列文章,让各个细分方向的用户都能轻松上手 MMDetection3D,基于框架进行自己的研究和开发。首先展示整个代码库的目录结构,方便初步认识:# MMDetection3D 代码目录结构,展示主要部分|- configs# 配置文件。
2024-10-23 18:50:11
2127
1
空空如也
conda创建虚拟环境出错
2025-02-20
kitti数据集可视化
2024-10-21
cuda版本显示不匹配
2024-09-24
Ubuntu启动盘安装出错
2024-08-09
安卓开发摄像头预览后获取实时数据出错
2024-05-06
安卓开发调用摄像头预览创建会话出错
2024-05-04
安卓开发调用摄像头获取实时数据时出错
2024-05-03
安卓开发摄像头预览出现问题
2024-05-02
安卓开发抽帧出现问题
2024-04-19
安卓开发视频抽帧处理
2024-04-19
安卓开发视频抽帧出现问题
2024-04-19
安卓开发对视频进行抽帧检测出错
2024-04-16
安卓开发视频抽帧检测出错
2024-04-15
安卓开发视频抽帧检测后展示
2024-04-14
安卓开发清除图像和视频后再次选择闪退
2024-04-09
安卓开发相册和摄像头权限访问问题
2024-04-08
安卓开发摄像头输入后无法显示图片
2024-04-01
安卓开发调用摄像头软件闪退
2024-03-29
安卓开发调用摄像头问题
2024-03-26
yolov5项目部署到手机端运行出错
2024-03-13
Coursera的机器学习中遇到的文件未找到问题
2023-12-29
吴恩达2022机器学习课程提问
2023-10-25
进行算法练习时遇到的问题
2023-07-09
非零返回的问题如何解决
2022-11-16
python编程nonetype问题
2022-11-02
tomcat运行报错
2022-10-01
javaweb页面上的数据无法显示
2022-09-30
vue框架写页面无法获取数据
2022-09-25
javaweb验证码图片无法加载
2022-09-19
TA创建的收藏夹 TA关注的收藏夹
TA关注的人