- 博客(6)
- 收藏
- 关注
原创 RT-DETR模型:在实时目标检测超越YOLO(附数据集,源码链接,项目搭建指南)
RT-DETR(Real-Time DEtection TRansformer)是一个实时的基于Transformer的目标检测模型,首先是论文:Attention Is All You Need),作为基础知识本文略。DETR (论文:End-to-End Object Detection with Transformers),见我上一篇博客。RT-DETR (论文:DETRsBeat YOLOsonReal-time Object Detection)。
2025-10-20 20:14:57
1091
原创 将Transformers用于目标检测的开山之作:DETR
而我们的真值则是几个框,预测框的数量N远远大于真实框的数量,为了实现一一对应我们要把真实框的数量补得和预测框数量一样多。:在DETR中,对于一张图片,我们的输出是N个预测框,一个框由2组参数代表,分别是框相对于图像的坐标x,y;再看第一部分,如果是有物体的真实框,我们就计算预测框的概率,概率是越大越好,所以我们给前面加个负号,这样都是越小越好了。,预测框点集中的点和真实框点集中的点进行有权重的连接,最后两两配对,总的权重加起来越小越好,(所以这个权重也可以说是损失)不过多了没有物体的真实框对应概率。
2025-10-12 21:58:02
872
原创 5分钟快速理解YOLO
给一张图片,我们要知道里面东西在哪,是什么东西,这就是目标检测。然后分类,检测这个东西是什么。问题难点在找框,YOLO之前的方法提出多种找框(定位)的方法,非常麻烦。个参数:宽w和高h,中心位置(x,y),还有置信度。理解上面这段话,对YOLO就有了本质的理解,里面还有大量的细节,比如参数归一化及其意义,损失函数具体的公式,网路内部结构。最后这个置信度0.9乘交并比,代表有多大把握框里有东西并且框得准。个类别,每个类别我们给一个置信度来表示是这个东西的概率。YOLO是这么做的:先画格子,有7*7=
2025-09-17 20:20:01
224
原创 关于deep image prior的最新调查论文:A survey on Deep Image Prior for image denoising
本文综述了2025年发表在《Digital Signal Processing》上关于深度图像先验(DIP)去噪方法的研究进展。文章系统梳理了DIP方法的发展脉络,从2018年Ulyanov提出的原始DIP框架出发,指出其优势在于无需训练数据即可去噪,但存在图像细节丢失、收敛速度慢、缺乏明确停止标准等问题。研究将DIP改进方法分为四类:理论研究(如基于MobileNet的盲评估网络)、网络结构优化(如DROP-DIP方法)、输入修改和损失函数改进(如加入TV正则化)。论文还对不同变体在高斯噪声下的去噪性能进
2025-08-13 21:54:48
1316
原创 Blind Deconvolution Using Alternating Maximum a Posteriori Estimation with Heavy-Tailed Priors图像盲复原
2016年的一篇关于盲图像复原的论文,主要使用增广拉格朗日方法交替求解图像u和模糊核h。
2025-06-01 19:42:23
777
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅