码元-优快云博客

原创快速总结D-FINE

通过较浅层的预测与来自较深层的细化输出对齐，使模型更早的加速收敛，提高整体性能。主流目标检测中，边框回归预测真值框的任务，受到本身回归公式的约束，将边界框边缘视为精确且固定的，使定位不确定性难以建模，必须通过L1损失和IOU损失函数对边缘预测的结果进行指导，在这个过程中收敛缓慢且性能不佳。对于边框回归，引入细粒度分布细化（FDR），将边界框回归从预测固定坐标转换为建模概率分布，从而提供更细粒度的中间表示， FDR 以残差方式迭代地细化这些分布，允许进行逐步更精细的调整，并提高定位精度。

2024-10-30 16:45:17 1229

原创 YOLOv11算法解析

YOLO系列主要以[v5,v8,v11]为主体发展，[v7,v9]和[v6]，v10则是在ultralytics的框架上进行创新改进，目前也归属到ultralytics中。V11支持多种视觉任务：物体检测、实例分割、图像分类、姿态估计和定向物体检测（OBB）。而本文主要以V8与V11进行对比，分析ultralytics团队主要做出的改进贡献。

2024-10-22 15:30:13 528

原创快速总结AFPN

特征金字塔架构的提出是为了解决尺度变化的问题，图像中物体真正有用的特征在顶部最高层需要通过多个中间尺度传播，并与这些尺度的特征交互，才能与底部的低层特征融合，便是最常见的是物体特征在缩放时丢失的细节信息，以经典的FPN网络为例，存在高层特征里面低层特征细节不足的问题。而在不同尺度的特征交互，可以避免传输中的信息丢失或退化，但是在特征融合中，逐元素求和不是一种有效的方法，因为不同级别之间在某个位置可能存在不同对象的矛盾。AFPN的引入在多融合过程中利用自适应空间融合操作来过滤特征，保留有用的信息进行融合。

2024-10-12 13:58:57 842

原创快速总结ACmix

自注意力机制：作者根据self-attention的原理，同样分解为两个阶段，把第一个阶段中将Q-K-V三个变量计算过程看成1×1的卷积核计算的过程。两个模块共享相同的1×1的卷积操作，重复使用计算后的特征图进行不同的聚合操作，最后将两个路径的输出加在一起，并由学习的参数进行控制比例。卷积操作：作者将核大小为K*K的卷积操作，进行分解为阶段一与阶段二，在阶段一的操作中存在着与1×1卷积核有着相同的计算构成的一部分。(2)提出了一种优雅的自注意力和卷积模块的集成方式，它兼具两者的优点。总之，上述分析表明，

2024-10-11 09:56:58 363

原创快速总结HAT

图像恢复(Image restoration)是计算机视觉中的一个经典问题，它的目的是从给定的低质量（LQ）输入重建高质量（HQ）图像。通过 LAM，我们可以判断哪些输入像素对所选区域贡献最大。在SwinIR基础上进行改进并提出HAT。

2024-10-10 15:26:27 266

原创营业执照印章检测识别技术落地项目

输入图片，对电子版和拍摄版都具体良好的效果。训练模型样本数量：一万张印章样本训练。有需要项目完整源码可私信报价。印章文字识别率100%印章文字准确率95%

2024-04-01 10:36:04 338 3

原创 python 利用描述器批量修改分组的属性值

问题：class中的属性值init_height是一个变量，另一个属性值real_height是以init_height为参数的计算公式算出的值，现在有多个此类，该如何管理这些类的数据，现在要求上述的代码具备以下两个功能：1.初始化时，不进行分组，后面指定部分类进行分组。2.要求同组的init_height属性值都是一样的，且当我二次更改class中的init_height属性值时，同组的class的real_height属性值都要更新，且更新后的值也是一样的。3.同时要求计算的方法是可以修改的。

2023-06-08 15:58:32 145

原创判断点在直线的左侧和右侧的方法及原理

判断点在直线的左侧和右侧的方法及其原理

2022-07-18 09:41:58 13303 6

原创关于python中占用内存的主要原因分析

```pythonimport sysclass Point: def __init__(self,x,y,z): self.x = x self.y = y self.z = ztest1 = {"x":1,"y":2,"z":3}test2 = [1,2,3]test3 = Point(1,2,3)test4 = (1,2,3)print("test1占用内存:",sys.getsizeof(test1))print("test2占用内存:",sys.getsizeof(.

2022-05-26 09:48:41 1665

原创 YOLO中Keras.compile函数说明

model.compile(optimizer='adam', loss={ 'yolo_loss': lambda y_true, y_pred: y_pred})参数说明： def compile(self, optimizer, loss=None, metrics=None, ...

2019-03-17 17:06:55 2253

原创 Generalized Intersection over Union(GIOU)论文核心思想解读笔记

Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression论文核心解读（最近在忙于考研(20)，所以这里就放核心的思想，详细的其他，以后有时间再补充吧）目录Generalized Intersection over Union: A Metric and A Loss ...

2019-03-01 11:04:30 9795 7

原创 Batch Normalization原理分析和算法详解笔记

前言众所周知，现阶段很多模型在反向传播算法的时候都选择的是随机梯度下降法，尽管随机梯度下降法对于训练深度网络简单高效，但是它有个毛病，就是需要我们人为的去选择参数，比如学习率、参数初始化、权重衰减系数、Drop out比例等。这些参数的选择对训练结果至关重要，以至于我们很多时间都浪费在这些的调参上。而batch normalization(后面简称BN算法)的出现打破了这样的局面——...

2019-01-28 14:43:21 1045

原创 CBAM: Convolutional Block Attention Module论文解读和算法原理解析笔记---注意力模型

前言这是去年ECCV2018的一篇文章，主要贡献为提出一个新的网络结构。之前有一篇论文提出了SENet，在feature map的通道上进行attention生成，然后与原来的feature map相乘。这篇文章指出，该种attention方法只关注了通道层面上哪些层会具有更强的反馈能力，但是在空间维度上并不能体现出attention的意思。CBAM作为本文的亮点，将attention同...

2019-01-26 15:48:27 6936

原创基于Tensorflow框架-------深度学习实战(一)LeNet模型完全解析

本文适合理论和原理都了解的学者，当然对于小白也可以共同学习，只不过无法讲的那么详细。机器学习届的"Hello World"就是MNIST数据集，因为笔者的电脑原因，配置不高，所有打算用MNIST作为模型框架的敲门砖。首先用卷积神经网络训练MNIST数据集，我们这里直接上经典的模型LeNet结构。这是LeNet模型的基本结构，现在进行分解：首先导入数据，这里使用的是MNI...

2018-11-06 11:00:18 1415 1

原创 Opencv4.0+VS2017环境配置教程

相比于OpenCV3.4的功能改进：1.OpenCV DNN模块新增ONNX解析器，支持各种分类网络，比如AlexNet, Inception v2, Resnet, VGG 等。部分支持tiny YOLO v2 目标检测网络。2.DNN模块新的改进2.1）支持Mask RCNN并新增里对应例程！2.2）使用Intel Inference Engine（Intel推断引擎），即In...

2018-10-12 19:26:24 21870 24

原创 Tenosorflow基础学习---------Tensorflow训练自己的数据集

一般我们获得的数据集并非是提前处理好的二进制的格式文件，所以我们需要将数据集进行处理，当然我们这里说的数据集类似于猫狗大战那样的，并不是MNIST和CIFAR-10那样拿来就可以直接用的，而且提前分类和标签的数据集，只不过给的是大量的图片，一般都是比赛提供方给的数据集，而对于这样的数据集当然不可能整张输入和读取，这样不仅的数据不仅数据量大，需要大量的内存消耗，而且时间也是相当的慢，于是在tenso...

2018-09-25 20:55:40 668 2

原创在复杂环境下，用Opencv手势和脸部区域提取

刚刚看完相关的opencv编程的书籍，于是自己想做点东西练练手要求是：对给定的图片中人体的脸部和手势进行提取现在先是对一张图片进行训练，再过度到小包（含有多张图片的文件夹），这是用摄像机对我同学进行拍摄的图片（希望他不会打我。。）先读出一张图片，对图片进行简单的噪声和滤波处理，然后转换成灰度图进行处理。这里我用的是高斯滤波，也可以用其他的方法，个人感觉高斯滤波效果好点肤色模...

2018-07-10 21:30:56 3069

xmid免费破解版下载，亲测有效放心使用

Xmind自带破解，里面有教程。Xmind是一款非常专业的思维导图软件，收费好几百元，不过还是很多用户，因为目前用的最多，也简单易用。XMind界面友好、功能优秀、可用性极强，从而数百万人选择了它，XMind不仅可以绘制思维导图，还能绘制鱼骨图、二维图、树形图、逻辑图、组织结构图（Org、Tree、Logic Chart、Fishbone）等。

2019-04-26

C51单片机RF905模板开发，最全的资料

基于C51和NRF905模块开发的无线通信，里面有中文的开发文档和一些可以直接运行的实战案例，也有很多基础案例

2018-09-16

课程设计家谱系统C

C/C++开发的家谱系统，内含文档报告，课程设计类，不可做商业用

2018-09-16

haarcascade_eye.xml+haarcascade_frontalface_alt2.xml

2018-09-11

在复杂环境下，对手势和脸部提取

对给定的图片中人体的脸部和手势进行提取,原博客有代码思路介绍和效果图演示https://blog.youkuaiyun.com/qq_39027890/article/details/80991515

2018-07-10

蓝桥杯测试数据

蓝桥杯里面的测试数据，包括vip的数据，可以通过数据知道自己是否运行成功

2017-12-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人