深度菜鸟-优快云博客

原创代码理解DETR和DeformableDETR

以下内容记录我在阅读DETR和Deformable DETR论文及源码过程中对网络结构、以及自注意力、可变形注意力的理解，可能存在一些错误，欢迎讨论~

2024-11-24 18:49:26 949

原创图像异常检测评估指标-分割性能

FPRFPR先利用阈值无关的指标（PRO CurveROC CurvePR CurveIoU Curve的形态以及曲线下面积）选择更有潜力的算法在1选出最有潜力算法的基础上，选择最优的阈值发挥出它最大的潜力（以适应实际应用场景）计算该特定阈值下的相关评估指标（TPRRecall)、FPR(误诊率)、PRCPrecision)、IoU），对应应用场景进行分析。

2024-10-19 16:04:38 1191 1

原创图像异常检测评估指标-分类性能

应对于工业需求，上述指标我们主要关注阈值相关的召回率Recall和误诊率FPR召回率高保证了异常样本查得全，误诊率低保证前面的查的全不是以“把大量正常样本预测为异常样本”而得到的虚假繁荣。而这不就是ROC Curve的横纵坐标吗？

2024-10-19 16:04:03 1374

不管是基于AE、VAE、GAN、diffusion、LDM，发展过程只是将重建子网络不断更换得更高级而已。这一组成部分(重建子网络)的目的却一直初心不改，即努力地重建正常（将正常图像很好地重建为正常，细节更丰富更接近原图；将异常图像重建(恢复)为对应的正常，尽可能把异常图像的异常部分给合理地恢复）。这是由基于正常重建思路来实现图像异常检测任务的本质决定的：致力于扩大正常图像和异常图像的重建误差差异。

2024-10-19 15:59:00 1649

原创基于异常合成的图像异常检测方法

基于异常合成思路实现图像异常检测的方法，它们的核心思路是：试图通过合成异常样本穷尽所有可能出现的异常类型，从而将无监督的异常检测（one class classification）建模为一个全监督的二分类问题。这就要求合成的异常样本数量足够多、质量足够好（和真实缺陷分布相同）、种类足够全（涵盖各种已知的和未知的真实缺陷）。

2024-10-19 15:57:29 1219

原创 CLIP代码运行

more。

2024-06-25 14:15:31 1288

原创运行PatchCore代码

原文发布于博客。

2024-06-25 14:12:32 987

原创 Linux服务器端使用conda

在使用服务器运行项目的时候，为了区隔不同的环境，常常需要创建虚拟环境，而conda就是实现这一功能的最常用的工具之一。

2024-03-10 16:24:24 1199 1

原创服务器端使用docker部署项目

Docker 是一个开源的应用容器引擎，让开发者可以打包他们的应用以及依赖包到一个可移植的镜像中，然后发布到任何流行的 Linux 机器上。使用Docker可以让每个应用彼此相互隔离，在同一台机器上同时运行多个容器，他们彼此之间共享同一个操作系统。Docker的优势在于，它可以在更细的粒度上进行资源的管理，比虚拟化技术性能更高，更加节约资源。下面是普通虚拟化技术和Docker的对比。more镜像 - Docker images容器 - Docker containers。

2024-03-10 16:22:40 1294 1

原创 GLIP论文理解

GLIP(是一个可扩展的（generalizable）目标检测模型（其实准确来说应该表述为短语定位模型，本句在这里将"目标检测"和"短语定位"任务混为一谈）在文章开头先解释一下GLIP论文中用到的一些"黑话"generalizable（可泛化）：侧重于描述模型，强调模型学到的特征能够泛化到新的情境。scalable（可扩展）：关注系统、算法、数据集的可扩展性，确保算法在面对更大规模、更复杂的情况时性能能够保持或提高。

2024-02-19 09:34:43 1208 1

原创 CLIP（Contrastive Language–Image Pre-training）论文理解

CLIP () 使用的方法非常简单，主要分为2个部分：more使用图像和文本进行对比学习预训练组件文本编码器：Transformer图像编码器：ResNet or Vision Transformer对比学习目标：通过最大化正样本对（图像和文本描述）的相似性，最小化负样本对（图像和不相关文本描述）的相似性来学习图像和文本的共享表示损失函数（InfoNCE loss）:论文MoCo提出，我们可以把对比学习看成是一个字典查询的任务，即训练一个编码器从而去做字典查询的任务。

2024-01-31 20:23:12 932

原创《动手学深度学习2.0》学习笔记（五）

给定一个凸集χ\chiχ,如果对于所有xx′∈Xxx′∈X和所有λ∈01λ∈01, 函数fX→RfX→R是凸的，我们可以得到λfx1−λfx′≥fλx1−λx′λfx1−λfx′≥fλx1−λx′凸函数在定义域上的任意两点之间的割线总在这两点连线的上方或者重合。当一个函数的二阶导数存在且大于0时，函数为凸函数。

2024-01-18 11:28:27 1048 1

原创《动手学深度学习2.0》学习笔记（四）

R-CNN对图像选取若干提议区域，使用卷积神经网络对每个提议区域执行前向传播以抽取其特征，然后再用这些特征来预测提议区域的类别和边界框。Fast R-CNN对R-CNN的一个主要改进：只对整个图像做卷积神经网络的前向传播。它还引入了兴趣区域汇聚层，从而为具有不同形状的兴趣区域抽取相同形状的特征。Faster R-CNN将Fast R-CNN中使用的选择性搜索替换为参与训练的区域提议网络，这样后者可以在减少提议区域数量的情况下仍保证目标检测的精度。

2024-01-18 11:26:59 1518 1

原创《动手学深度学习2.0》学习笔记（三）

《动手学深度学习2.0》学习笔记（三）《动手学深度学习2.0》电子书的链接地址为https://zh.d2l.ai/index.html本文记录了我在学习本书8-10章节（包括循环神经网络、现代循环神经网络、注意力机制）过程中的理解和收获。笔记首次发布于我的博客https://valoray.github.io/，排版比优快云稍好看一些，但内容是一致的。循环神经网络引言data：表格数据、图像数据、序列数据。对于表格数据和图像数据，我们默认所有样本都是独立同分布的表格数据：通常利用机器

2024-01-18 11:24:21 1004 1

原创《动手学深度学习2.0》学习笔记（二）

动手学深度学习2.0》电子书的链接地址为https://zh.d2l.ai/index.html本文记录了我在学习本书5-7章节（包括深度学习计算、卷积神经网络、现代卷积神经网络）过程中的理解和收获。笔记首次发布于我的博客https://valoray.github.io/，排版比优快云稍好看一些，但内容是一致的。more。

2024-01-18 11:23:23 1258 1

原创《动手学深度学习2.0》学习笔记（一）

动手学深度学习2.0》电子书的链接地址为https://zh.d2l.ai/index.html本文记录了我在学习本书前4章节（包括引言、预备知识、线性神经网络、多层感知机）过程中的理解和收获。more。

2024-01-18 11:20:25 1092 1

原创 pycharm连接云服务器

【代码】pycharm连接云服务器。

2023-12-28 20:49:38 580 1

原创 FasterRCNN代码分析（二）

特征提取器用于从图像中提取特征，RPN网络用于生成目标的候选区域，头部网络用于在这些候选区域上进行分类和回归。：这个文件是项目的主程序，它首先加载数据集，然后创建Faster R-CNN模型和训练器，接着进入一个循环，每个循环代表一个训练周期，在每个训练周期中，它会遍历数据集中的所有图像，并使用训练器的。的RPN网络所需的目标：这些目标包括每个锚点对应的ground truth边界框的偏移和比例（用于边界框回归任务），以及每个锚点是否包含物体的标签（用于前景/背景分类任务）

2023-12-28 20:31:52 907 1

原创 Faster RCNN项目部署（一）

我舍弃了利用fire.Fire()来调用函数train，而是直接在main函数中调用了train()方法，并传递了参数。因此，先利用Xshell映射云端服务器的visdom（参见上面的博客），再在jupyter notebook运行以下代码。解决：我也不知道咋解决，因为另外测试后发现PIL的Image.open()是可以用的，我重启了几次不知道为什么就能用了。另外，Pycharm在调试过程会遇到一个问题，即：debug时Pycharm卡住在connected界面不动。最终得到的数据目录如下。

2023-12-28 20:25:41 810 1

原创 Faster RCNN论文理解

基于候选区域的CNNs(RCNN、SPPnet、FastRCNN…)在目标检测领域取得了很好的效果，尤其是共享卷积特征及大地降低了计算代价，提高了训练和测试的速度。如果忽略产生候选区域(region proposals)的耗时，Fast RCNN输入一张图片和其候选区域后几乎可以实现实时检测。因此，现在检测系统的计算瓶颈主要在于产生候选区域的部分。Selective Search (SS)产生一张图片的2000个候选区域要耗时2s，EdgeBoxes则要耗时0.2s（两种方法都只有CPU实现）——太慢了！

2023-12-26 15:46:44 929

m0_51619560的博客

原创代码理解DETR和DeformableDETR

原创 Flow-based生成模型理解

原创图像异常检测评估指标-分割性能

原创图像异常检测评估指标-分类性能

原创生成模型初认识

原创基于正常重建的图像异常检测方法