
深度学习
jinggegebuaa
这个作者很懒,什么都没留下…
展开
-
Stylenga_pytorch 代码解析
import argparseimport mathimport randomimport osimport numpy as npimport torchfrom torch import nn, autograd, optimfrom torch.nn import functional as Ffrom torch.utils import dataimport torch.distributed as distfrom torchvision import transform.原创 2021-08-18 15:00:25 · 1523 阅读 · 0 评论 -
生成器代码分析
输入是一个:一个随机的向量获取方式为:原创 2021-08-11 11:17:12 · 248 阅读 · 0 评论 -
stylegan2-pytorch 自己训练的model 出错
CUDA_VISIBLE_DEVICES=1 python train.py --batch 16 lmdb_test_0806/解决方法:CUDA_VISIBLE_DEVICES=1 python generate.py --size 256 --ckpt ./checkpoint/550000.pt5500000的这个模型是作者发布得模型2800000这个是我自己训练的模型我训练的步骤为:python prepare_data.py --out LMDB_PATH --...原创 2021-08-10 15:12:25 · 7107 阅读 · 6 评论 -
GPEN 损失函数
作者使用了三个损失函数:1. 参数的设置: 感知损失: https://blog.youkuaiyun.com/zyr_freedom/article/details/115255300感知损失函数代码调试:...原创 2021-08-09 18:49:58 · 607 阅读 · 0 评论 -
sytlengan2 代码解析
real_img = next(loader) real_img = real_img.to(device) #生成器设置为False,判别器设置为True requires_grad(generator, False) requires_grad(discriminator, True) #生成噪声 noise = mixing_noise(args.batch, args.latent,...原创 2021-08-06 20:04:26 · 293 阅读 · 0 评论 -
Video-Swin-Transformer (二)
跑单卡测试和多卡测试都有问题:然后去看了mmaction2下面的recognizer3D下面没有SwinTransformer3d的类但是师妹说她可以跑通训练我的训练也报同样的错误?要怎么解决这个问题原创 2021-07-14 20:47:21 · 1648 阅读 · 4 评论 -
预训练模型导致的问题 --预训练模型上传的时候没有上传成功
mismatch for layer1.0.conv1.weight: copying a param with shape torch.Size([64, 64, 3, 3]) from checkpoint, the shape in current model is torch.Size([64, 64, 1, 1]).size mismatch for layer1.1.conv1.weight: copying a param with shape torch.Size([64, 64, 3.原创 2021-06-05 18:12:53 · 3589 阅读 · 0 评论 -
senet-运行和结构篇
senet 新认识senet 的结构:从这个上面我们是实际上是看不太清楚se 模块加在哪里的其中:1. Squeeze部分。即为压缩部分,原始feature map的维度为H*W*C,其中H是高度(Height),W是宽度(width),C是通道数(channel)。Squeeze做的事情是把H*W*C压缩为1*1*C,相当于把H*W压缩成一维了,实际中一般是用global average pooling实现的。H*W压缩成一维后,相当于这一维参数获得了之前H*W全局的视野,感受原创 2021-05-27 17:12:39 · 357 阅读 · 1 评论 -
.WeightedRandomSampler(3)
问题描述: 最早一批数据是2500 多张,新一批的数据有36000 多张。然后最近训练的时候,设置train_nums 设置为36000但是实际训练的时候,貌似不太行,总是报各种错误train_nums=36000train_sampler=torch.utils.data.WeightedRandomSampler(weights=sampler_weights,num_samples=train_nums, ...原创 2021-05-25 14:51:52 · 205 阅读 · 0 评论 -
resnet 优化之cbam
1. cbamhttps://blog.youkuaiyun.com/qq_44666320/article/details/105694019https://blog.youkuaiyun.com/qq_38410428/article/details/1036947592. se netclass ChannelAttention(nn.Module): def __init__(self, in_planes, ratio=16): super(ChannelAttention, s原创 2021-05-19 18:32:57 · 2996 阅读 · 0 评论 -
resnet18 参数解读
global_params=GlobalParams(block=block,num_classes=num_classes,zero_init_residual=zero_init_residual,groups=groups,width_per_group=width_per_group,replace_stride_with_dilation=replace_strid...原创 2021-05-19 18:26:19 · 4604 阅读 · 0 评论 -
resnet18 结构
可以看到在fc层之前的一层是avgpool层其实就是卷积只有alenet才是3个全连接吧原创 2021-05-18 18:07:14 · 377 阅读 · 0 评论 -
全连接与卷积
用卷积代替全连接有以下优点:1. 更灵活,不需要限定输入图像的分辨率;- 这个怎么理解是测试阶段的不需要限定输入的分辨率还是训练阶段也不需要限制输入的分辨率? 为什么我觉得其实是都需要?我认为不能做到不需要限制图像的分辨率,比如我的图像是224的和图像是256的那么,到达全连接层前面一层的结果是不一样的对吧 比如我如果使用224的输入,那么alxnet输入到全连接层前面一层的结果是 7x7x512 如果我的输入尺寸比这个尺寸大,那么我得到的结果理论上比这个数值大更具...原创 2021-05-18 15:50:36 · 387 阅读 · 0 评论 -
图像增强(一):randaugment
因为Fast Augment了解到randaugment我们以deit为例:code:paper:https://arxiv.org/pdf/1909.13719.pdf伪代码:号称用两行代码可以搞定这个问题从上图我们看到有两个超参。--其实实现要比这个复杂。一个是N (变化的个数)这个一般N是14变化的种类为:一个是M :所有变换的幅值 (我目前的理解是M *T(image))--如果我的理解有错误,欢迎指正T是对原始图像做的转换转换的结果乘以M得...原创 2021-05-13 17:39:00 · 3242 阅读 · 1 评论 -
自己关于pytorch transfomers 的一个误区
关于transfomers的一个误区,我之前认为是输入一个图进去,输出是5个图然后对应标签是一个但是现在看来输入一个图输出一个图跟标签一起送到网络里面去打印输出为:就是给一张图,但是我经过变换其实一张图这样label就不会变化...原创 2021-04-22 15:05:49 · 137 阅读 · 0 评论 -
weightedrandomSamplers(2)
在上面的基础之上,修改了:现在样本的权重设置为:shuffle 设置为 Falsetrain_num 设置为256同样的:batch_size 设置为256现在的训练精度为:比之前看上去正常多了之前的结果是:现在的疑问是:train_num 与 batch_size 区别在那里...原创 2021-04-16 15:10:34 · 140 阅读 · 1 评论 -
weightedrandomSamplers(1)
样本不均衡问题一直机器学习甚至传统方法学习的主要问题一般从损失函数和样本采样的角度来处理这个问题损失函数比较相关的:1.focallos2.eqlloss样本采样相关的: 在网上搜到:加权随机采样WeightedRandomSampler自己在使用的时候:错误分析:这个是对样本做的权重均衡,并不是对类别做的权重均衡。有人说如果设置的num_sample的值大于weight的个数会报错但是我没有报错如果是对样本进行加权的话,这样我只是...原创 2021-04-14 19:25:59 · 569 阅读 · 1 评论 -
linux 下测速时间分析
测出来的时间为:解决方法为:struct timeval tpstart,tpend; float timeuse; gettimeofday(&tpstart,NULL); int index = HST_ClerkDetect(handle, img.data, img.cols, img.rows);//目标分类 gett原创 2017-11-09 16:46:24 · 409 阅读 · 0 评论 -
泰坦x 和泰坦black 性能分析
我的gpu 时间都是在泰坦black 上测试的原创 2017-10-26 16:40:41 · 1645 阅读 · 0 评论 -
人脸检测SSD 记录
人脸检测现在是有现成的数据库,wider-face 这个数据集有12000张。有的图片里面有有1-2个人,有的图片里面是集会的图片;http://blog.youkuaiyun.com/qq_14845119/article/details/52372546有很多图片是模糊的和blur 的所有要把这些样本清除掉现在策略需要注意的问题是要在voc 的model 上预训练 所以学习率不原创 2017-11-15 20:53:06 · 2287 阅读 · 2 评论 -
SSD 学习
前段时间有甲方要求输出每个检测框的特征,目的是想判断不同图片中相同目标的相似度比较高,不同目标的相似度比较低。实现目标的reid。小伙伴跟我说ssd输出的目标 因为分五个阶段,所以不清楚那个目标框是从那个阶段输出的。如何返回找到对应的目标。因为不像 faster 那样,一个图对应一个feature map 有框的位置 去feature map 里面去找相应的位置。在这个周围取一个区域,...原创 2018-08-27 23:02:58 · 282 阅读 · 0 评论 -
pytorch 训练人脸精度不达标
原创 2019-05-14 10:10:27 · 491 阅读 · 0 评论