长沙有肥鱼-优快云博客

原创 YOLOv5/YOLOv8/YOLOv9改进——将损失函数改进为MPDIoU

💡 🎈🎄🎋🎍🎉🎑🎫🎞🎪🎁🎎🧵🛒🧶🥽🏅🥉🥇🥇🏅🏆🏆🥉💡 🎈🎄🎋🎍🎉🎑🎫🎞🎪🎁🎎🧵🛒🧶🥽🏅🥉🥇🥇🏅🏆🏆🥉💡 🎈🎄🎋🎍🎉🎑🎫🎞🎪🎁🎎🧵🛒🧶🥽🏅🥉🥇🥇🏅🏆🏆🥉💡 🎈🎄🎋🎍🎉🎑🎫🎞🎪🎁🎎🧵🛒🧶🥽🏅🥉🥇🥇🏅🏆🏆🥉💡 🎈YOLOv5/YOLOv8/YOLOv9改进——将损失函数改进为MPDIoU

2024-06-25 13:19:41 744 1

原创 YOLOv5/YOLOv8/YOLOv9改进——将损失函数改进为shape_iou

💡 🎈🎄🎋🎍🎉🎑🎫🎞🎪🎁🎎🧵🛒🧶🥽🏅🥉🥇🥇🏅🏆🏆🥉损失函数shape_iou本文使用的YOLOv5版本为v7.0，YOLOv8、YOLOv9均为最新版本。默认的损失函数为CIOU。shape_iou论文链接：https://arxiv.org/pdf/2312.17663.pdf

2024-06-14 11:27:57 1106 1

原创 YOLOv5/YOLOv8/YOLOv9改进——将损失函数改进为inner_iou、inner_giou、inner_diou、inner_ciou、inner_eiou、inner_siou

💡 🎈🎄🎋🎍🎉🎑🎫🎞🎪🎁🎎🧵🛒🧶🥽🏅🥉🥇🥇🏅🏆🏆🥉损失函数inner_iou本文使用的YOLOv5、YOLOv8、YOLOv9版本均为最新版本。论文链接：https://arxiv.org/pdf/2311.02877.pdf

2024-06-11 11:51:50 1181 6

原创 leetcode73 矩阵置零

🎄leetcode73 矩阵置零

2024-04-10 14:05:30 622 1

提出，使用了一种不同的方法来计算误差协方差矩阵。它不使用(连续时间)黎卡提方程(Riccati Equations,形如。的一类非线性方程)或(离散时间)协方差传播和更新规律。关键的思想是基于一组特殊的样本点来估计误差协方差，这些点被称为。无迹卡尔曼滤波(Unscented Kalman Filter),最初由。点(Sigma Points)，这些点直接通过原始非线性模型传播。无迹变换表示有三个特殊样本点的高斯分布，称为。

2024-04-03 10:15:41 1108 3

原创 leetcode36 有效的数独

leetcode36 有效的数独

2024-04-01 16:28:09 466

原创 yolov8训练自己的数据集

yolov8训练自己的数据集

2024-03-19 22:24:49 1274

原创 YOLOV9训练自己的数据集

yolov9训练自己的数据集

2024-03-17 22:36:28 3507 4

原创 YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information全文翻译

今天的深度学习方法关注的是如何设计最合适的目标函数，使模型的预测结果最接近真实值。同时，必须设计一个适当的体系结构，以方便获取足够的预测信息。现有方法忽略了一个事实，即输入逐层进行特征提取和空间变换时，会丢失大量的信息。本文将深入研究数据在深度网络中传输时的重要数据丢失问题，即信息瓶颈和可逆函数。我们提出了可编程梯度信息(PGI)的概念，以应对深度网络实现多个目标所需的各种变化。PGI可以为目标任务提供完整的输入信息来计算目标函数，从而获得可靠的梯度信息来更新网络权值。此外，设计了一种新的基于梯度路径规划的

2024-02-26 16:03:22 1258

原创使用python将批量pdf转换为word

使用python将批量pdf转换为word

2024-01-12 11:31:10 731

原创 leetcode17 电话号码的字母组合

leetcode17 电话号码的字母组合

2024-01-11 16:29:52 1261

原创 Shape-IoU: More Accurate Metric considering Bounding Box Shape and Scale

作为检测定位分支的重要组成部分，边界框回归损失在目标检测任务中起着重要作用。现有的边界框回归方法通常考虑GT框和预测框之间的几何关系，通过相对位置和框形来计算损失，而忽略边界框的固有属性（如边界框的形状和尺寸）对边界框回归的影响。为了弥补现有研究的不足，本文提出了一种关注边界框自身形状和尺寸的边界框回归方法。首先，分析了边界框的回归特性，并发现边界框自身的形状和尺寸因素将对回归结果产生影响。基于上述结论提出了Shape IoU方法，该方法通过关注边界框自身的形状和尺寸来计算损失，从而使边界框回归更准确。

2024-01-06 14:28:53 2387 3

原创 leetcode13 罗马数字转整数

leetcode13 罗马数字转整数

2024-01-03 17:21:57 805

原创 leetcode12 整数转罗马数字

leetcode12 整数转罗马数字

2024-01-02 17:01:49 1153

原创 matplotlib科研绘图之折线图、柱状图、散点图、误差棒

matplotlib科研绘图之折线图、柱状图、散点图、误差棒

2023-12-19 17:13:17 1200

原创 Inner-IoU: More Effective Intersection over Union Loss with Auxiliary Bounding Box翻译

2023-12-01 16:46:54 1403

原创 leetcode128 最长连续序列

🚀🏆🍀✨👇👇👇🌴🎄🎈🚀🔥🔥🔥🌟🍀🎉🎉🎉🎉leetcode128 最长连续序列

2023-10-24 09:23:34 293

原创 leetcode1 两数之和

leetcode 两数之和

2023-10-20 13:46:36 139

原创 tdms格式转换为csv格式的python脚本

tdms格式转换为csv格式的python脚本

2023-10-18 13:12:55 1102

原创 FREAK: Fast Retina Keypoint全文翻译

大量的视觉应用程序依赖于匹配图像中的关键点。过去十年的特点是朝着更快、更鲁棒的关键点和关联算法的军备竞赛:尺度不变换特征(SIFT)[17]，加速鲁棒特征(SURF)[4]，以及最近的二进制鲁棒不变可伸缩关键点(BRISK)[16]等等。如今，视觉算法在智能手机和低内存和计算复杂度的嵌入式设备上的部署甚至提高了权重:目标是使描述符更快地计算，更紧凑，同时保持对缩放、旋转和噪声的鲁棒性。为了最好地解决当前的需求，我们提出了一种新的关键点描述符，灵感来自人类视觉系统，更准确地说是视网膜，称为Fast reti

2023-10-12 16:32:37 396

原创 Distinctive Image Features from Scale-Invariant Keypoints (SIFT)全文翻译

本文提出了一种从图像中提取独特不变特征的方法，可用于不同视角之间目标或场景的可靠匹配的方法。这种特点对图像的尺度和旋转具有不变性。并在大范围的仿射变换，三维视点的改变，噪音和光照变化的图像匹配具有鲁棒性。特征是highly distinctive的，使场景图像中的单一特征和许多图像中提取的大型特征数据库一样，有很高的正确匹配率。本文还介绍了一个使用该特征来识别目标的方法。通过将个别特征与由已知目标特征组成的数据库进行快速最近邻算法的匹配，然后使用Hough变换来识别属于单一目标的类簇(clusters)，最

2023-10-11 15:39:23 502

原创 AttributeError: module ‘numpy‘ has no attribute ‘object‘

result = {**result, **{train_no: np.zeros(tuple_, dtype=np.object)}} # 使用train_no作为键，创建一个形状为tuple_的全零数组作为值。result = {**result, **{train_no: np.zeros(tuple_, dtype=np.object)}} # 使用train_no作为键，创建一个形状为tuple_的全零数组作为值。解决办法：(降低numpy的版本)

2023-10-11 10:03:01 6841

原创 Speeded-Up Robust Features (SURF)全文翻译

这篇文章提出了一种尺度和旋转不变的检测子和描述子，称为SURF(Speeded-Up Robust Features)。SURF 在可重复性、鉴别性和鲁棒性方面都接近甚至超过了以往的方案，同时计算和比较的速度更快。这依赖于使用了积分图进行图像卷积、使用现有的最好的检测子和描述子（特别是，基于 Hessian 矩阵方法的检测子，和基于分布的描述子）、以及简化这些算法到了极致。这些最终实现了新的检测、描述和匹配过程的结合。本文包含对检测子和描述子的

2023-10-10 14:35:11 487

原创 python——argwhere（）函数

函数功能：返回数组里面大于某个设定值的数对应的索引。函数功能：返回数组里面大于某个设定值的数对应的索引。

2023-10-09 11:14:31 726

原创 BRISK: Binary Robust Invariant Scalable Keypoints全文翻译

从图像中有效和高效地生成关键点是文献中深入研究的问题，并形成了许多计算机视觉应用的基础。该领域的领导者是SIFT和SURF算法，它们在各种图像转换下表现出出色的性能，其中SURF算法被认为是迄今为止高性能方法中计算效率最高的。本文提出了一种用于关键点检测、描述和匹配的新方法BRISK。对基准数据集的全面评估显示，尽管计算成本大大降低(在某些情况下比SURF快一个数量级)，但BRISK在最先进的算法中具有自适应的高质量性能。提高速度的关键在于应用了一种新型的基于尺度空间FAST的检测器，并结合了从每个关键

2023-10-09 09:57:54 594

原创 python——ptp()函数

【代码】python——ptp()函数。

2023-09-27 11:42:02 841

原创 python--------------apply_along_axis()函数

python--------------apply_along_axis()函数

2023-09-26 14:45:49 1004

原创 MPDIoU: A Loss for Efficient and Accurate Bounding BoxRegression

提出了一种新的基于最小点距离的边界框相似性比较指标MPDIoU，该指标包含了现有损失函数中考虑的所有相关因素，即重叠或不重叠区域、中心点距离、宽度和高度偏差，同时简化了计算过程。在此基础上，我们提出了基于MPDIoU的边界框回归损失函数，称为LMPDIoU。实验结果表明，MPDIoU损失函数应用于最先进的实例分割(如YOLACT)和基于PASCAL VOC、MS COCO和IIIT5k训练的目标检测(如YOLOv7)模型，其性能优于现有的损失函数

2023-09-05 22:42:07 6595 1

原创 AP值计算

AP值计算

2023-05-29 15:41:53 1017 2

原创 YOLOv5-7.0训练中文标签的数据集

YOLOv5训练中文标签的数据集

2023-05-01 14:55:20 2211 1

原创 DAMO-YOLO : A Report on Real-Time Object Detection Design

提出了一种被称为DAMO-YOLO的快速准确的物体检测方法，该方法比最先进的YOLO系列具有更高的性能。DAMO-YOLO是由YOLO扩展而来的，它采用了一些新技术，包括神经结构搜索(NAS)、高效的重参数化泛化FPN (RepGFPN)、具有AlignedOTA标签分配的轻量级头部和蒸馏增强。特别地，我们使用最大熵原理指导的MAE-NAS方法在低延迟和高性能的约束下搜索我们的检测骨干，生成具有空间金字塔池和焦点模块的ResNetlike / CSP-like结构。在颈部和头部的设计上，我们遵循“大颈部，小

2023-01-31 11:56:38 2641

原创 Minimal BASH-like line editing is supported.For the fist word,TAB lists possible ...

Minimal BASH-like line editing is supported.For the fist word,TAB lists possible command completions.Anywhere else TAB lists possible device or file completions.

2023-01-04 18:06:19 10879 3

原创神经网络画图与图片格式svg转换为jpg或png

神经网络画图工具与图片格式转换

2022-11-30 14:14:21 656

原创 Searching for MobileNetV3翻译

轻量化网络MobileNetV3

2022-11-01 16:26:38 886

原创 NameError: name ‘Optional‘ is not defined

pytorch报错解决

2022-10-24 22:43:08 6695

原创 yolov7训练自己的数据集及报错处理

yolov7训练自己的数据集及报错处理，其实和yolov5差不太多

2022-10-07 23:59:31 17784 17

原创 python脚本——批量重命名、视频帧截取图片、图片合成视频、jpg文件批量读取绝对路径

python脚本——批量重命名、视频帧截取图片、图片合成视频、jpg文件批量读取绝对路径

2022-10-07 23:27:43 1211

原创无卷积步长或池化:用于低分辨率图像和小物体的新 CNN 模块SPD-Conv

No More Strided Convolutions or Pooling:A New CNN Building Block for Low-ResolutionImages and Small Objects 无卷积步长或池化:用于低分辨率图像和小物体的新 CNN 模块SPD-Conv提出了一个名为SPD-Conv的新的CNN构建块，它完全消除了步长和池化操作，取而代之的是一个空间到深度卷积和一个无步长卷积。

2022-10-06 16:17:58 19906 20

原创 AssertionError: File not found: data\hyps\hyp.scratch.yaml

报错修改

2022-10-04 16:33:56 6131 1

原创 yolov5模型修改报错

yolov5模型修改

2022-10-03 16:12:59 3053 4

Shape-IoU: More Accurate Metric considering Bounding Box Shape a

2024-01-06

Inner-IoU: More Effective Intersection over UnionLoss with Auxil

随着检测器的快速发展，边界框回归（BBR）损失函数不断进行更新和优化。然而，现有的IoU基于BBR仍然集中在通过添加新损失项来加速收敛，忽略了IoU损失项本身的局限性。尽管从理论上讲，IoU损失可以有效地描述边界框回归的状态，但在实际应用中，它无法根据不同的检测器和检测任务进行自适应调整，且不具备较强的泛化能力。基于上述情况，我们首先分析了BBR模型，并得出结论：区分不同的回归样本以及使用不同尺度的辅助边界框计算损失可以有效加速边界框回归过程。对于高IoU样本，使用较小的辅助边界框计算损失可以加速收敛，而较大的辅助边界框适合于低IoU样本。然后，我们提出了Inner-IoU损失，通过辅助边界框计算IoU损失。对于不同的数据集和检测器，我们引入一个缩放因子比来控制计算损失的辅助边界框的尺度大小。最后，将Inner-IoU集成到现有的IoU基于损失函数中进行仿真和对比实验。实验结果表明，利用本文提出的方法进一步提高了检测性能，验证了Inner-IoU损失的有效性和泛化能力。

2023-12-01

Distinctive Image Features from Scale-Invariant Keypoints全文翻译

2023-10-11

FREAK: Fast Retina Keypoint FREAK:快速视网膜关键点

摘要大量的视觉应用程序依赖于匹配图像中的关键点。过去十年的特点是朝着更快、更鲁棒的关键点和关联算法的军备竞赛:尺度不变换特征(SIFT)[17]，加速鲁棒特征(SURF)[4]，以及最近的二进制鲁棒不变可伸缩关键点(BRISK)[16]等等。如今，视觉算法在智能手机和低内存和计算复杂度的嵌入式设备上的部署甚至提高了权重:目标是使描述符更快地计算，更紧凑，同时保持对缩放、旋转和噪声的鲁棒性。为了最好地解决当前的需求，我们提出了一种新的关键点描述符，灵感来自人类视觉系统，更准确地说是视网膜，称为Fast retina keypoint (FREAK)。通过在视网膜采样模式上有效地比较图像强度来计算二进制字符串的级联。我们的实验表明，FREAKs通常在较低的内存负载下计算更快，而且比SIFT、SURF或BRISK更鲁棒。因此，它们是现有关键点的有竞争力的替代品，特别是对于嵌入式应用程序。

2023-02-27

BRISK: Binary Robust Invariant Scalable Keypoints BRISK:二进制鲁棒不变可

摘要从图像中有效和高效地生成关键点是文献中深入研究的问题，并形成了许多计算机视觉应用的基础。该领域的领导者是SIFT和SURF算法，它们在各种图像转换下表现出出色的性能，其中SURF算法被认为是迄今为止高性能方法中计算效率最高的。本文提出了一种用于关键点检测、描述和匹配的新方法BRISK。对基准数据集的全面评估显示，尽管计算成本大大降低(在某些情况下比SURF快一个数量级)，但BRISK在最先进的算法中具有自适应的高质量性能。提高速度的关键在于应用了一种新型的基于尺度空间FAST的检测器，并结合了从每个关键点邻域的专用采样检索的强度比较中提取的位串描述符。

2023-02-27

GMS: Grid-Based Motion Statistics for Fast, Ultra-robust Feature

GMS:基于网格的快速运动统计，超鲁棒的特征对应摘要特征匹配的目的是在图像之间生成对应关系，在许多计算机视觉任务中被广泛应用。尽管在特征描述符和初始对应假设的快速匹配方面已经取得了相当大的进展，但从中选择好的特征描述符仍然是具有挑战性的，对整体性能至关重要。更重要的是，现有的方法通常需要很长的计算时间，限制了它们在实时应用程序中的使用。本文试图在高速下将真实对应与错误对应进行分离。我们将所提出的方法(GMS)称为基于网格的运动统计，它将平滑度约束纳入用于分离的统计框架中，并使用基于网格的实现进行快速计算。GMS对各种具有挑战性的图像变化具有鲁棒性，包括视点、比例和旋转。它也很快，例如，在单个CPU线程中只需要1或2毫秒，即使处理50K的通信。这对实时应用程序具有重要意义。更重要的是，我们表明，将GMS纳入经典特征匹配和极面几何估计管道可以显著提高整体性能。最后，我们将GMS集成到著名的ORB-SLAM系统中进行单目初始化，结果显著改善。关键词:特征匹配;外极几何;视觉SLAM;运动结构;GMS

2023-02-27

TA关注的人

Shape-IoU: More Accurate Metric considering Bounding Box Shape a

Inner-IoU: More Effective Intersection over UnionLoss with Auxil

Distinctive Image Features from Scale-Invariant Keypoints全文翻译

FREAK: Fast Retina Keypoint FREAK:快速视网膜关键点

BRISK: Binary Robust Invariant Scalable Keypoints BRISK:二进制鲁棒不变可

GMS: Grid-Based Motion Statistics for Fast, Ultra-robust Feature

Searching for MobileNetV3

无卷积步长或池化:用于低分辨率图像和小物体的新 CNN 模块SPD-Conv

基于拉普拉斯金字塔深度残差的单目深度估计

Semi-supervised Anomaly Detection using AutoEncoders PDF

Semi-supervised Anomaly Detection using AutoEncoders

YOLOv4: Optimal Speed and Accuracy of Object Detection全文翻译PDF

YOLOv4: Optimal Speed and Accuracy of Object Detection全文翻译

YOLOv3: An Incremental Improvement论文全文翻译

GMS特征点提取与匹配全文翻译(Word)

opencv轮廓检测报错