自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 YOLO系列之一: YOLO-V1

yolo-v1介绍

2024-09-04 23:32:29 1066

原创 MobileViT原理与代码总结

MobileViT原理和代码介绍

2024-09-04 22:43:42 1098

原创 VIT(Vision Transformer)系列论文汇总

虽然transformer有比较强的全局特征提取能力,但是没有偏置(局部特征提取能力受限),计算量大,耗时(和分辨率的平方成正比的计算复杂度)等。笔者认为,想学好transformer在CV领域的应用,并且最终能够用到自己的工作或项目当中,甚至提出新的网络结构,应该要全面地先对transformer的优缺点有充足的了解以及理解;并且全面了解其发展,以及每个时期的不同transformer为基础的网络结构的变化,改进方法,相互之间的联系。通过大量阅读相关的论文,以及代码,来建立起一个相对完整的知识体系。

2024-09-02 23:31:27 1034

原创 原始VIT(Vision Transformer)总结(原理与代码)

论文地址:2010.11929 (arxiv.org) 参考代码地址:GitHub - google-research/vision_transformer Transformer最开始是NLP领域提出的一篇文章,transformer因为其长依赖捕捉,出色的全局特征提取,以及关键特征相关性表征的能力,在NLP领域(比如机器翻译等)取得了巨大的成功。而Transformer中最突出的一个结构就是多头自注意力(multi-head self-attention), 通过这种toke

2024-09-01 15:48:08 1227

原创 模型量化入门介绍——从谷歌白皮书学模型量化(2)

白皮书中在介绍完量化方式后,做了一些训练实验,然后得出了一些结论,以及一些测速相关的。篇幅有限,这里就不多说,只想给大家交代重点内容,其他的大家可以自行阅读。最后来到量化建议和总结。1. 模型结构设计上,不要限制激活值的范围。(比如relu比relu6好)2. 权衡好量化位宽。参数多的模型,量化鲁棒性一般会相对好一些,可以考虑更低的量化位宽,然而需要权衡,比如用30层的卷积,使用4bit的量化位宽,和10层的卷积,采用8bit的量化位宽,这个需要权衡。

2024-08-05 23:40:35 1364

原创 模型量化入门介绍——从谷歌白皮书学模型量化(1)

谷歌的量化白皮书()绝对是模型量化入门学习的必读资料,回顾自己在量化工作中踩的一些坑,十分后悔没有提前阅读这个资料,否则对于一个刚做模型量化的小白来说,很多不必要的坑可以规避,而且更能对量化这件事有一个整体的理解。下面一起大致回顾一下这个小编认为的入门必读的文章。(文章只是对一些小编认为比较重要的部分进行介绍,更希望读者能自行再读一下原文)

2024-07-31 22:06:58 1325

原创 DDPM代码详解(一)

比如一个batch有四个样本,每个样本的步长在[1, 1000]中随机生成,比如可以是[50, 100, 94, 786]。5. 接下来要实现逆向生成过程:逆向生成过程也是按照前面原理部分的公式得到的,只是把数学公式用代码表达而已。由于默认总步数是1000步,但是为了适配不同的定义,可以自己指定总步数,因此这里就会对每一步的步长进行缩放。至此,原始DDPM的代码已经实现了,还差一个生成噪声的network的定义,之后将在下一次代码详解中介绍。首先我们从整体来思考一下,DDPM的代码实现,会包含哪些部分。

2024-03-23 22:43:54 2566 3

原创 Diffusion简介

简单介绍图像生成diffusion

2024-03-23 20:35:29 1777

原创 Diffusion原理详解(二:逆向过程原理)

当然如果对公式推理感兴趣的同学,可以阅读一下原文,公式推导的过程其实也是一个很好的思维锻炼的过程。以𝜽为模型参数,反向生成的原始图像的分布,与真实原始图像的分布的,距离, 不大于 (≤), 各个阶段(𝑡 = 0,𝑡 = 1, 𝑇 − 1 ,𝑡 = 𝑇)以𝜽为模型参数, 反向生成的图像分布与该阶段真实图像分布的 距离 【KL-Divergence】和。公式(11)中红色的部分,这个式子里面出现的都是前向过程的参数,而根据文章最开始列出的前向过程推导公式,这个式子的分布我们是可以表达出来的。

2024-03-17 22:44:49 3179

原创 Diffusion原理详解(一:前向过程原理)

在之前diffusion简介中,简单的描述了diffusion的基础原理,我们知道了diffusion有两个过程,这里将详细介绍一下这两个过程以及数学原理。在这个加噪的过程中,我们假设当前的图像只依赖前一个时刻的图像和新加的噪声(假设加噪的过程符合马尔科夫过程)。至此,通过完整的公式推导, 介绍了diffusion的前向过程的原理,之后将继续介绍diffusion的逆向过程原理。前向过程是一个逐步加噪的过程,每一步加入的都是随机的高斯噪声,这里我们把 t 时刻的图像记为。根据公式(8)可以一直推到用。

2024-03-16 23:57:23 780

原创 量化感知训练 —— LSQ(二:代码解析)

至此,我们实现了伪量化算子,伪量化算子中利用伪量化方法进行参数伪量化,之后又定义了伪量化的类来实现伪量化方法。之后需要做的是,就是把原模型中的各个算子,替换成这里定义好的对应的伪量化算子,这样我们就可以实现一个插入LSQ伪量化节点的模型了,然后利用这个模型进行正常的训练,就可以进行LSQ量化感知训练了。在这个伪量化算子中,其中还有伪量化方法需要作为输入传入进行初始化的,而具体的伪量化,以及需要学习的量化参数的更新方法,则通过伪量化方法实现。对于其他的算子,比如nn.Linear,则使用类似的定义实现。

2024-03-10 16:05:13 1462 7

原创 量化感知训练——LSQ(一:原理)

模型量化知识总结

2024-03-03 21:01:44 2970 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除