- 博客(12)
- 收藏
- 关注
原创 史上最详细的Swin-Transformer 掩码机制(mask of window attentation)————shaoshuai
详细解释Swin-Transformer的滑动窗口机制和掩码机制,从代码的角度讲解,结合图文。
2022-06-04 11:46:39
6538
7
原创 [CPnet]第三部分解读
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言 一、pandas是什么? 二、使用步骤 1.引入库 2.读入数据 总结前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。提示:以下是本篇文章正文内容,下面案例可供参考一、pandas是什么?示例:pandas 是基于NumPy 的一种工具,该工具是为了解决.
2022-05-17 20:31:46
996
原创 [CPNet]-理想亲和图的生成以及作用——Blank
文中理想亲和图由Ground truth下采样后,又采用One-Hot编码方式生成。其中Ground Truth为原图片大小,其中每个像素位置不再是像素值,而是该像素所在的类别。文中One-Hot编码的例子如下:图中最左边H*W大小的矩阵由Ground Truth下采样生成。One-Hot编码过程如下:首先图像中一共由三类图像0、1、2。于是可将这三类分别重新编码为0 0 1,0 1 0,1 0 0,(如果为四类就是0001,0010,0100,1000,以此类推)然后将重新编码的矩阵进
2022-04-25 18:49:52
596
原创 [CPNet]阅读笔记粗略记录-cfsong
写在前边,这是很久之前看的。具体内容已经忘记,把过程粗略写出来供大家参考吧Context Prior for Scene SegmentationAbstract:有监督最近的语义分割工作广泛探索了上下文相关性,以实现更准确的细分结果。但是,大多数方法很少区分不同类型的上下文依赖项,这可能会有损场景理解。在这项工作中,我们直接监督特征聚合以清楚地区分类内和类间上下文信息。具体来说,我们在Affinity Loss监督下开发出Context Prior(上下文先验)。 给定输入图像和相应的gt,A
2022-04-25 17:00:36
284
原创 【Pranet】论文及代码解读(ResNet部分)——jialiang nie
1.ResNet结构简介ResNet——残差神经网络最重要的一个思想在于对接收的数据进行卷积等一系列操作后(F(x)),再与自身的identity(x)进行相加(即F(x)+x),之后一起经过relu层,这样一个模块叫做残差模块,而残差神经网络就是由多个残差模块以及其他一些层结合构成的。残差神经网络有18层、34层、50层等等,值得一提的是从第50层开始残差模块与之前有一些区别——多了一些1*1的卷积层,这个目的是解决在最后进行F(x)+x操作时维度不一样的问题,同时可以使我们网络的计算复杂度减
2022-04-12 20:04:25
806
原创 [PraNet]训练文件train.py详解——shaoshuai
1、train.py从main函数开始,首先规定了参数。以上参数大多都是见名知意的,下面对某些重要参数做解释。--lr:学习率。学习率的大小代表梯度下降的快慢,在使用Adam的优化函数时,lr的默认初始值为e-4。 --batchsize。每次训练时一个批的数据中包含多少张图片。 --clip。梯度裁剪。这个参数用在对梯度下降的梯度进行裁剪,这时为了防止梯度爆炸。将梯度限制在一定范围内。2、输入增强。为了增强模型的鲁棒性,增加可输入的图片,这里对图片进行增强处理。3、模型训
2022-04-12 20:02:39
2498
原创 【PraNet】论文代码解读(损失函数部分)——Blank
文中采用的总体损失为:其中IoU为交并比,BCE为二元交叉熵。在计算损失时使用加权值得方式,使整个模型偏向图像中物体的边缘部分。关于加权,文中取像素值周围15个像素值(上下左右个各15个),形成31*31的矩阵。计算矩阵中数值的平均值,之后计算平均值与该像素值的差值,这样可以计算该像素点与周围像素点的差异。由于我们只在乎差异的大小,所以需要取绝对值。weit = 1 + 5*torch.abs(F.avg_pool2d(mask, kernel_size=31, stride=1, pad
2022-04-12 19:30:29
4231
1
原创 【PraNet】主要架构解读-------wmilk
Res2net:A new multi-scale backbone architecture(Res2net:一种新的多尺度骨干架构)· 图一右边模块在左边传统的瓶颈块中增加了多分支结构,此分支能够对输入图像进行不同像素大小的观察,拓展了系统对图像的感受视野,能增加读取的信息量。...
2022-04-12 19:23:01
1206
3
原创 【Pranet】论文及代码解读(RFB与aggregation部分)——Cavy岚
目录一、RFB部分学习笔记1.神经学基础 2.受视觉研究启发得出的RFB3.原论文中提出的RFB结构:4.PraNet中的RFB结构:二、aggregation部分学习笔记三、代码:RFB及aggregation定义在PraNet中所应用到部分的节选:一、RFB部分学习笔记论文:Receptive Field Block Net for Accurate and Fast Object Detection论文链接:https://arxiv...
2022-04-12 19:12:01
6123
原创 【Pranet】论文及代码解读——cfsong
模型框架整体模型架构1、Res2Net50Res2Net是在原始的ResNet的基础上加入了一个scale (s = 4)维度,将原始的3×3(通道数是n)滤波器替换成一组有w个通道的3×3滤波器2、Paralleled Connection该模块包含两部分:一部分是扩大感受野的RFB-like multi-scale module , 3.反转注意力模块:模型训练模型测试实验结果:.
2022-04-11 12:33:11
2471
3
原创 图像分割conda环境搭建
最近在做医疗图像分割,先把环境搭建备份一下。第一步:从清华源上下一下https://mirrors.tuna.tsinghua.edu.cn/help/anaconda/,下最新的就行了。有中文介绍的。使用教程随便找了个https://www.jianshu.com/p/eaee1fadc1e9。第二步 安装pytorch网址https://pytorch.org/ 选择环境就好 选1.1https://pytorch.org/get-started/previous-versions/第三步 安
2021-12-06 21:31:12
724
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人