- 博客(199)
- 资源 (7)
- 收藏
- 关注
原创 YOLOv5/YOLOv8/YOLOv9改进——将损失函数改进为MPDIoU
💡 🎈🎄🎋🎍🎉🎑🎫🎞🎪🎁🎎🧵🛒🧶🥽🏅🥉🥇🥇🏅🏆🏆🥉💡 🎈🎄🎋🎍🎉🎑🎫🎞🎪🎁🎎🧵🛒🧶🥽🏅🥉🥇🥇🏅🏆🏆🥉💡 🎈🎄🎋🎍🎉🎑🎫🎞🎪🎁🎎🧵🛒🧶🥽🏅🥉🥇🥇🏅🏆🏆🥉💡 🎈🎄🎋🎍🎉🎑🎫🎞🎪🎁🎎🧵🛒🧶🥽🏅🥉🥇🥇🏅🏆🏆🥉💡 🎈YOLOv5/YOLOv8/YOLOv9改进——将损失函数改进为MPDIoU
2024-06-25 13:19:41
744
1
原创 YOLOv5/YOLOv8/YOLOv9改进——将损失函数改进为shape_iou
💡 🎈🎄🎋🎍🎉🎑🎫🎞🎪🎁🎎🧵🛒🧶🥽🏅🥉🥇🥇🏅🏆🏆🥉损失函数shape_iou本文使用的YOLOv5版本为v7.0,YOLOv8、YOLOv9均为最新版本。默认的损失函数为CIOU。shape_iou论文链接:https://arxiv.org/pdf/2312.17663.pdf
2024-06-14 11:27:57
1106
1
原创 YOLOv5/YOLOv8/YOLOv9改进——将损失函数改进为inner_iou、inner_giou、inner_diou、inner_ciou、inner_eiou、inner_siou
💡 🎈🎄🎋🎍🎉🎑🎫🎞🎪🎁🎎🧵🛒🧶🥽🏅🥉🥇🥇🏅🏆🏆🥉损失函数inner_iou本文使用的YOLOv5、YOLOv8、YOLOv9版本均为最新版本。论文链接:https://arxiv.org/pdf/2311.02877.pdf
2024-06-11 11:51:50
1181
6
原创 无迹卡尔曼滤波(UKF)推导
提出,使用了一种不同的方法来计算误差协方差矩阵。它不使用(连续时间)黎卡提方程(Riccati Equations,形如。的一类非线性方程)或(离散时间)协方差传播和更新规律。关键的思想是基于一组特殊的样本点来估计误差协方差,这些点被称为。无迹卡尔曼滤波(Unscented Kalman Filter),最初由。点(Sigma Points),这些点直接通过原始非线性模型传播。无迹变换表示有三个特殊样本点的高斯分布,称为。
2024-04-03 10:15:41
1108
3
原创 YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information全文翻译
今天的深度学习方法关注的是如何设计最合适的目标函数,使模型的预测结果最接近真实值。同时,必须设计一个适当的体系结构,以方便获取足够的预测信息。现有方法忽略了一个事实,即输入逐层进行特征提取和空间变换时,会丢失大量的信息。本文将深入研究数据在深度网络中传输时的重要数据丢失问题,即信息瓶颈和可逆函数。我们提出了可编程梯度信息(PGI)的概念,以应对深度网络实现多个目标所需的各种变化。PGI可以为目标任务提供完整的输入信息来计算目标函数,从而获得可靠的梯度信息来更新网络权值。此外,设计了一种新的基于梯度路径规划的
2024-02-26 16:03:22
1258
原创 Shape-IoU: More Accurate Metric considering Bounding Box Shape and Scale
作为检测定位分支的重要组成部分,边界框回归损失在目标检测任务中起着重要作用。现有的边界框回归方法通常考虑GT框和预测框之间的几何关系,通过相对位置和框形来计算损失,而忽略边界框的固有属性(如边界框的形状和尺寸)对边界框回归的影响。为了弥补现有研究的不足,本文提出了一种关注边界框自身形状和尺寸的边界框回归方法。首先,分析了边界框的回归特性,并发现边界框自身的形状和尺寸因素将对回归结果产生影响。基于上述结论提出了Shape IoU方法,该方法通过关注边界框自身的形状和尺寸来计算损失,从而使边界框回归更准确。
2024-01-06 14:28:53
2387
3
原创 Inner-IoU: More Effective Intersection over Union Loss with Auxiliary Bounding Box翻译
随着检测器的快速发展,边界框回归(BBR)损失函数不断进行更新和优化。然而,现有的IoU基于BBR仍然集中在通过添加新损失项来加速收敛,忽略了IoU损失项本身的局限性。尽管从理论上讲,IoU损失可以有效地描述边界框回归的状态,但在实际应用中,它无法根据不同的检测器和检测任务进行自适应调整,且不具备较强的泛化能力。基于上述情况,我们首先分析了BBR模型,并得出结论:区分不同的回归样本以及使用不同尺度的辅助边界框计算损失可以有效加速边界框回归过程。对于高IoU样本,使用较小的辅助边界框计算损失可以加速收敛,而较
2023-12-01 16:46:54
1403
原创 FREAK: Fast Retina Keypoint全文翻译
大量的视觉应用程序依赖于匹配图像中的关键点。过去十年的特点是朝着更快、更鲁棒的关键点和关联算法的军备竞赛:尺度不变换特征(SIFT)[17],加速鲁棒特征(SURF)[4],以及最近的二进制鲁棒不变可伸缩关键点(BRISK)[16]等等。如今,视觉算法在智能手机和低内存和计算复杂度的嵌入式设备上的部署甚至提高了权重:目标是使描述符更快地计算,更紧凑,同时保持对缩放、旋转和噪声的鲁棒性。为了最好地解决当前的需求,我们提出了一种新的关键点描述符,灵感来自人类视觉系统,更准确地说是视网膜,称为Fast reti
2023-10-12 16:32:37
396
原创 Distinctive Image Features from Scale-Invariant Keypoints (SIFT)全文翻译
本文提出了一种从图像中提取独特不变特征的方法,可用于不同视角之间目标或场景的可靠匹配的方法。这种特点对图像的尺度和旋转具有不变性。并在大范围的仿射变换,三维视点的改变,噪音和光照变化的图像匹配具有鲁棒性。特征是highly distinctive的,使场景图像中的单一特征和许多图像中提取的大型特征数据库一样,有很高的正确匹配率。本文还介绍了一个使用该特征来识别目标的方法。通过将个别特征与由已知目标特征组成的数据库进行快速最近邻算法的匹配,然后使用Hough变换来识别属于单一目标的类簇(clusters),最
2023-10-11 15:39:23
502
原创 AttributeError: module ‘numpy‘ has no attribute ‘object‘
result = {**result, **{train_no: np.zeros(tuple_, dtype=np.object)}} # 使用train_no作为键,创建一个形状为tuple_的全零数组作为值。result = {**result, **{train_no: np.zeros(tuple_, dtype=np.object)}} # 使用train_no作为键,创建一个形状为tuple_的全零数组作为值。解决办法:(降低numpy的版本)
2023-10-11 10:03:01
6841
原创 Speeded-Up Robust Features (SURF)全文翻译
这 篇 文 章 提 出 了 一 种 尺 度 和 旋 转 不 变 的 检 测 子 和 描 述 子 , 称 为SURF(Speeded-Up Robust Features)。SURF 在可重复性、鉴别性和鲁棒性方面都接近甚至超过了以往的方案,同时计算和比较的速度更快。这依赖于使用了积分图进行图像卷积、使用现有的最好的检测子和描述子(特别是,基于 Hessian 矩阵方法的检测子,和基于分布的描述子)、以及简化这些算法到了极致。这些最终实现了新的检测、描述和匹配过程的结合。本文包含对检测子和描述子的
2023-10-10 14:35:11
487
原创 python——argwhere()函数
函数功能: 返回数组里面大于某个设定值的数对应的索引。函数功能: 返回数组里面大于某个设定值的数对应的索引。
2023-10-09 11:14:31
726
原创 BRISK: Binary Robust Invariant Scalable Keypoints全文翻译
从图像中有效和高效地生成关键点是文献中深入研究的问题,并形成了许多计算机视觉应用的基础。该领域的领导者是SIFT和SURF算法,它们在各种图像转换下表现出出色的性能,其中SURF算法被认为是迄今为止高性能方法中计算效率最高的。本文提出了一种用于关键点检测、描述和匹配的新方法BRISK。对基准数据集的全面评估显示,尽管计算成本大大降低(在某些情况下比SURF快一个数量级),但BRISK在最先进的算法中具有自适应的高质量性能。提高速度的关键在于应用了一种新型的基于尺度空间FAST的检测器,并结合了从每个关键
2023-10-09 09:57:54
594
原创 python--------------apply_along_axis()函数
python--------------apply_along_axis()函数
2023-09-26 14:45:49
1004
原创 MPDIoU: A Loss for Efficient and Accurate Bounding BoxRegression
提出了一种新的基于最小点距离的边界框相似性比较指标MPDIoU,该指标包含了现有损失函数中考虑的所有相关因素,即重叠或不重叠区域、中心点距离、宽度和高度偏差,同时简化了计算过程。在此基础上,我们提出了基于MPDIoU的边界框回归损失函数,称为LMPDIoU。实验结果表明,MPDIoU损失函数应用于最先进的实例分割(如YOLACT)和基于PASCAL VOC、MS COCO和IIIT5k训练的目标检测(如YOLOv7)模型,其性能优于现有的损失函数
2023-09-05 22:42:07
6595
1
原创 DAMO-YOLO : A Report on Real-Time Object Detection Design
提出了一种被称为DAMO-YOLO的快速准确的物体检测方法,该方法比最先进的YOLO系列具有更高的性能。DAMO-YOLO是由YOLO扩展而来的,它采用了一些新技术,包括神经结构搜索(NAS)、高效的重参数化泛化FPN (RepGFPN)、具有AlignedOTA标签分配的轻量级头部和蒸馏增强。特别地,我们使用最大熵原理指导的MAE-NAS方法在低延迟和高性能的约束下搜索我们的检测骨干,生成具有空间金字塔池和焦点模块的ResNetlike / CSP-like结构。在颈部和头部的设计上,我们遵循“大颈部,小
2023-01-31 11:56:38
2641
原创 Minimal BASH-like line editing is supported.For the fist word,TAB lists possible ...
Minimal BASH-like line editing is supported.For the fist word,TAB lists possible command completions.Anywhere else TAB lists possible device or file completions.
2023-01-04 18:06:19
10879
3
原创 python脚本——批量重命名、视频帧截取图片、图片合成视频、jpg文件批量读取绝对路径
python脚本——批量重命名、视频帧截取图片、图片合成视频、jpg文件批量读取绝对路径
2022-10-07 23:27:43
1211
原创 无卷积步长或池化:用于低分辨率图像和小物体的新 CNN 模块SPD-Conv
No More Strided Convolutions or Pooling:A New CNN Building Block for Low-ResolutionImages and Small Objects 无卷积步长或池化:用于低分辨率图像和小物体的新 CNN 模块SPD-Conv提出了一个名为SPD-Conv的新的CNN构建块,它完全消除了步长和池化操作,取而代之的是一个空间到深度卷积和一个无步长卷积。
2022-10-06 16:17:58
19906
20
Shape-IoU: More Accurate Metric considering Bounding Box Shape a
2024-01-06
Inner-IoU: More Effective Intersection over UnionLoss with Auxil
2023-12-01
Distinctive Image Features from Scale-Invariant Keypoints全文翻译
2023-10-11
FREAK: Fast Retina Keypoint FREAK:快速视网膜关键点
2023-02-27
BRISK: Binary Robust Invariant Scalable Keypoints BRISK:二进制鲁棒不变可
2023-02-27
GMS: Grid-Based Motion Statistics for Fast, Ultra-robust Feature
2023-02-27
无卷积步长或池化:用于低分辨率图像和小物体的新 CNN 模块SPD-Conv
2022-10-06
基于拉普拉斯金字塔深度残差的单目深度估计
2022-05-30
Semi-supervised Anomaly Detection using AutoEncoders PDF
2022-04-29
Semi-supervised Anomaly Detection using AutoEncoders
2022-04-29
YOLOv4: Optimal Speed and Accuracy of Object Detection全文翻译PDF
2022-04-13
YOLOv4: Optimal Speed and Accuracy of Object Detection全文翻译
2022-04-13
opencv轮廓检测报错
2023-10-13
TA创建的收藏夹 TA关注的收藏夹
TA关注的人