自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 收藏
  • 关注

原创 AAAI 2025一种遥感半监督目标检测方法的中文解读

以上是本人对遥感半监督目标检测的一些分析和方案,个人认为动机比较明确,但创新比较乏,好在性能不错。该工作历经两次投稿,第一次投了MM(对应Arxiv版本),分数5441(6满分)😭;第二次投了AAAI,顺利接受(7666,满分10)。这是本人第一篇科研工作,各位大佬的任何批评指正对本人接下来的科研认知都会产生正向作用,鞭策才能进步!

2025-02-28 09:02:49 935

原创 遥感道路分割连通性衡量指标APLS的自定义测试

目前没有一个统一的代码框架,能完成自定义的分割数据集从(img,mask)到APLS的评估。我调研了很多资料,最终凑了一个。

2024-10-23 10:55:56 506

原创 离散DDPM推导

所以就产生了一个想法,能否把DDPM推导成离散的形式,就是在mask的one-hot标签上加噪,然后再逆扩散。在one-hot标签上直接添加高斯噪音优点奇怪,所以我想把它加上类似伯努利噪音的形式,以下是推导过程,经过验证是有效的。然而,DDPM里为了保证采样过程的随机性,将从分布中采样这一过程重参数化了。这样一个label进行采样,0.8对应的索引类别会一直被选,而事实上前两个类别概率虽然小,但是也会有可能被采样出来的。这里需要根据上面的加噪过程,推导出逆扩散过程的真实分布参数,作为模型需要学习的目标。

2024-08-27 12:39:42 520

原创 从工程和理论角度理解DDPM(一)

从工程和理论角度理解DDPM目录从工程和理论角度理解DDPM说明1.与VAE的区别和关系2.变分推断3.ELBO继续推导4.reconstruction termreconstruction \ termreconstruction term5.denoising matching termdenoising \ matching \ termdenoising matching term说明紧接着上一篇VAE,继续整理DDPM。1.与VA

2024-07-23 15:32:38 976

原创 从工程和理论角度理解DDPM(二)

6.扩散(加噪)过程求Qϕ(xt−1∣xt,x0)Q_{\phi}\left(x_{t-1} \mid x_{t}, x_{0}\right)Qϕ​(xt−1​∣xt​,x0​)的表达式,我们首先要知道扩散过程中干了什么,即确定Qϕ(x1:T∣x0)Q_{\phi}(x_{1: T} \mid x_{0})Qϕ​(x1:T​∣x0​)。给定真实图片样本 x0x_{0}x0​,扩散过程通过 TTT次累计对其添加高斯噪声,得到 x1,x2,…,xTx_{1}, x_{2}, \ldots, x_{T}x1​

2024-07-23 15:31:17 904

原创 从工程和理论角度理解VAE

奈何看了很多网络上的博客,大家的出发点好像都不太一样,越看越懵了。看了原论文以及一些有名的博客之后,自己也有了些理解,故在此整理一下。于是概率密度估计的问题就转换成了映射问题,即如何从一个简单的人为预设分布。分布一定是非常复杂的,将其预设成一个简单的高斯分布或是什么分布,那对其采样生成的效果一定不好。但是这样有一个问题,就是该方法是一个参数估计的方法,也就是我们必须首先知道。,又因为该分布未知,所以可以用神经网络去拟合,即引入encoder。这样造成的问题是,在训练生成器decoder时采样出来的。

2024-07-13 15:55:34 833 1

原创 Depth-wise Convolution 和 Point-wise Convolution 以及 Depth-wise Separable Convolution

那如果用Depth-wise Separable Convolution产生HxWx1大小的最终特征图,就要先经过Depth-wise Convolution,卷积核大小为3x3x1,一共C个;再经过Point-wise Convolution,此时需要的卷积核大小为1x1xN,总参数量为3x3xC + 1x1xN。假设初始特征图为HxWxC大小,经过普通卷积3x3xC大小的卷积核,得到HxWx1的最终特征图,此时普通卷积的参数量为3x3xC;

2023-08-30 16:42:24 1549 2

原创 目标检测xml标注转txt标注

【代码】目标检测xml标注转txt标注。

2023-08-11 09:49:07 659

原创 目标检测数据集目标尺度分析

【代码】目标检测数据集目标尺度分析。

2023-07-25 21:04:55 466

原创 pytorch权重加载以及冻结部分权重设置

冻结部分参数进行训练。

2023-07-22 15:24:02 683

原创 mac ssh远程登录服务器免密设置

在mac上打开终端。一般私钥存放在.ssh目录里,所以cd到~/.ssh目录。可以先ls查看一下是否存在私钥和公钥文件。拥有.pub结尾的文件是公钥文件,无.pub的是私钥文件。

2023-07-07 14:04:39 2650

原创 Barrier:不同设备共享鼠标

mac下载dmg文件,下载好后可能会出现“mac无法打开APP,因为无法验证开发者”的情况,打开系统偏好设置–》安全隐私,点击下面的任何APP。ubuntu20.04以上的系统可以直接在ubuntu自带的软件下载中心里下载。我的是18.04的,只能。这里记录一下mac和ubuntu18.04的下载方法,编译好后在APP页面就能看到Barrier软件了。下载完成后应该就会出现了。

2023-06-21 15:12:26 613

原创 DDPM扩散模型公式推理----扩散和逆扩散过程

本文章旨在梳理DDPM这篇论文中的各个公式含义及推导,很多内容从其他博客处摘录,在文后列举。打个比方,就像是给你一块木头,让你把它雕刻成一个佛像,需要栩栩如生。Diffusion model在推理阶段就是在执行逆扩散过程,也就是雕刻佛像的过程。用数学语言进行描述,生成式模型本质上是从一组概率分布中得到另一组概率分布。如下图所示,左边是一个训练数据集,里面所有的数据都是从某个数据pdata p_{\text {data }}pdata ​中独立同分布取出的随机样本。右边就是其生成式模型(概率分布),在这种概率

2023-06-15 11:00:24 4189 3

原创 对onnx文件里的冗余节点“identity”进行修剪

在进行模型部署的过程中,我发现转换好的onnx模型含有大量的“identity”节点。实测过程中发现,这些节点不会影响onnx的推理结果,也不会影响onnx转换成的tensorrt推理引擎的推理结果,但是会严重影响onnx的推理速度。同时转换成的tensorrt文件也比正常的大很多,推理速度也会受到严重影响。所以在此记录对“identity”节点的修剪过程和代码。

2023-05-29 11:06:44 2089 3

原创 自定义代码进行Network Slim剪枝

最近的项目需要最后进行检测算法的部署,部署后的算法推理速度不是很快,需要对模型进行剪枝。我参考的剪枝算法是2017 ICCV上的一篇经典剪枝算法:《Learning Efficient Convolutional Networks through Network Slimming》。算法的原理也很简单,需要用到的前置知识就是先理解Batch Normalization的原理,而针对BN的原理我在这篇文章中进行了简要分析,需要的可以看看。

2023-05-27 12:12:49 628 2

原创 Python cv2视频帧合成

python利用opencv将图片合成视频

2023-05-17 11:30:58 428

原创 Batch Normalization和梯度消失以及梯度爆炸的原理

本文章是自己参考一些书籍和博客整理的一些Batch Normalization相关资料,通篇是基于自己的理解进行的整理,以作为日后参考使用。参考资料在文后贴出。Batch Normalization可以用于解决梯度消失和梯度爆炸问题,也包括原论文里提到的内部协方差转移(Internal Covariate Shift),所以本文章先整理了一些梯度消失和梯度爆炸以及内部协方差转移出现的原理,然后再进行Batch Normalization原理的解析。

2023-05-16 10:31:37 783

原创 deformconv2d转onnx出现IndexError: Argument passed to at() was not in the map.

可能是由于torch1.13.1与一些torch2onnx转换算子不匹配导致,可以把torch版本降低些,我这里降到了1.12.1,运行成功。

2023-04-21 14:34:43 1202

原创 jetson orin nx模组刷机及环境配置(二)

前篇文章把系统和一些环境配好了,接下来可以根据自己的需求配置一些其他的包。由于项目需要,本人配了pytorch,opencv with cuda,在此继续记录一下。

2023-04-10 21:14:33 2911 5

原创 jetson orin nx 模组刷机及环境配置(一)

刚接到板子时板子上已经装好了jetson-linux系统,但是由于第一次接触,不知道要用sdk manager刷机,就直接手动装cuda和tensorrt等环境了。装到一半发现不对劲,一些包根本不能像普通linux主机一样装!另外板子是aarch64架构的,一些包也没有。折腾了几天终于成功配置了一些包,记录下来以便以后查看。

2023-04-10 18:54:36 7441 8

原创 目标检测评价指标Precision、Recall、mAP

目标检测评估指标

2023-04-05 08:56:08 2270

原创 已知中心点、长宽和旋转角度,求矩形的四个顶点坐标(Python)

本次实现有几个前提:可以将情况分为两种,即θ∈[0,π/2]\theta \in [0, \pi/2]θ∈[0,π/2]和θ∈[π/2,π]\theta \in [\pi/2, \pi]θ∈[π/2,π]先看第一种情况θ∈[0,π/2]\theta \in [0, \pi/2]θ∈[0,π/2]:已知矩形的中心点(x,y)(x, y)(x,y),旋转角度θ\thetaθ在图中用橙色标注。先来求(x1,y1)(x_1,y_1)(x1​,y1​),用到图中绿色的辅助线,用到的三角形都标注了角θ\thetaθ

2023-03-16 12:07:50 8986 3

原创 DeformableConv(可形变卷积)理论和代码分析

DeformableConv(可形变卷积)理论和代码分析

2023-02-21 20:49:44 7146 3

原创 Focal Loss代码及数学原理解析笔记

RetinaNet网络中Focal Loss数学原理分析,以及代码解析

2023-02-11 11:46:43 599

原创 目标检测VOC标注格式中,将斜框标注转化为水平框

目标检测VOC格式数据集xml文件标注为polygon的斜框,通过代码转换成水平框

2022-12-27 10:35:04 2508 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除