自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 RT-DETR模型:在实时目标检测超越YOLO(附数据集,源码链接,项目搭建指南)

RT-DETR(Real-Time DEtection TRansformer)是一个实时的基于Transformer的目标检测模型,首先是论文:Attention Is All You Need),作为基础知识本文略。DETR (论文:End-to-End Object Detection with Transformers),见我上一篇博客。RT-DETR (论文:DETRsBeat YOLOsonReal-time Object Detection)。

2025-10-20 20:14:57 1091

原创 将Transformers用于目标检测的开山之作:DETR

而我们的真值则是几个框,预测框的数量N远远大于真实框的数量,为了实现一一对应我们要把真实框的数量补得和预测框数量一样多。:在DETR中,对于一张图片,我们的输出是N个预测框,一个框由2组参数代表,分别是框相对于图像的坐标x,y;再看第一部分,如果是有物体的真实框,我们就计算预测框的概率,概率是越大越好,所以我们给前面加个负号,这样都是越小越好了。,预测框点集中的点和真实框点集中的点进行有权重的连接,最后两两配对,总的权重加起来越小越好,(所以这个权重也可以说是损失)不过多了没有物体的真实框对应概率。

2025-10-12 21:58:02 872

原创 5分钟快速理解YOLO

给一张图片,我们要知道里面东西在哪,是什么东西,这就是目标检测。然后分类,检测这个东西是什么。问题难点在找框,YOLO之前的方法提出多种找框(定位)的方法,非常麻烦。个参数:宽w和高h,中心位置(x,y),还有置信度。理解上面这段话,对YOLO就有了本质的理解,里面还有大量的细节,比如参数归一化及其意义,损失函数具体的公式,网路内部结构。最后这个置信度0.9乘交并比,代表有多大把握框里有东西并且框得准。个类别,每个类别我们给一个置信度来表示是这个东西的概率。YOLO是这么做的:先画格子,有7*7=

2025-09-17 20:20:01 224

原创 关于deep image prior的最新调查论文:A survey on Deep Image Prior for image denoising

本文综述了2025年发表在《Digital Signal Processing》上关于深度图像先验(DIP)去噪方法的研究进展。文章系统梳理了DIP方法的发展脉络,从2018年Ulyanov提出的原始DIP框架出发,指出其优势在于无需训练数据即可去噪,但存在图像细节丢失、收敛速度慢、缺乏明确停止标准等问题。研究将DIP改进方法分为四类:理论研究(如基于MobileNet的盲评估网络)、网络结构优化(如DROP-DIP方法)、输入修改和损失函数改进(如加入TV正则化)。论文还对不同变体在高斯噪声下的去噪性能进

2025-08-13 21:54:48 1316

原创 Blind Deconvolution Using Alternating Maximum a Posteriori Estimation with Heavy-Tailed Priors图像盲复原

2016年的一篇关于盲图像复原的论文,主要使用增广拉格朗日方法交替求解图像u和模糊核h。

2025-06-01 19:42:23 777

原创 LAMA学习笔记(附GitHub链接)

m 代表所有像素点,d 对应特征向量维度,再模型中表现为卷积通道数。

2025-05-07 18:31:30 572

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除