- 博客(117)
- 资源 (1)
- 收藏
- 关注
原创 Windows C++ yolov5->ONNX->TensoRT (ResNet、FCN)
这个博客是以yolov5为例的 ,但是这一套流程我是用ResNet分类、FCN分割和yolo检测都是能走通的,更重要的方法掌握。
2022-05-04 10:16:48
3114
3
原创 VS没有Debug或者Release选项
C++和IDE都不熟悉,搞了一整天。以没有Debug为例,首先可以在配置管理这里添加一个Debug然后,打开项目管理器->链接器->调试->生成调试信息改一下。
2022-04-12 14:09:23
3745
原创 torchvision resnet使用groups分组卷积后参数量变大
例如设置model=resnet50(groups=2)参数量是groups=1时接近两倍原因:在定义中有width代表了基准的通道数默认为64,即第一个CONV后的C为64.这里的groups设置并不是常规的分组卷积的groups,而是将基准的通道数扩张了groups倍。更改的话直接把*groups删掉就好了。...
2022-04-02 20:02:23
601
1
原创 取出tensor的梯度
自己在用的时候,直接使用a.grad报错。正确的方法:https://zhuanlan.zhihu.com/p/168443176
2022-01-29 16:25:06
1681
原创 语义分割 混淆矩阵 miou计算
https://blog.youkuaiyun.com/sinat_29047129/article/details/103642140
2021-11-05 11:11:27
809
原创 align_corners torch上采样
https://zhuanlan.zhihu.com/p/87572724?from_voters_page=true其中:align_corners=True 配合 8x+1 的尺寸,可以相对于 aling_corners=False 配合 8x 的尺寸,减少内插的数目,并且避免外插。
2021-10-18 15:05:15
193
原创 torch 将图像分成patch
img 原始shape=(3,256,256)img = img.view(3,4,64,4,64)img = img.permute(1,3,0,2,4)此时img[i][j] 0<=i<4,0<=j<4代表每一个patch
2021-09-15 16:28:17
3756
1
原创 First Order Motion Model for Image Animation
静态图像视频生成First Order Motion Model for Image Animationhttps://blog.youkuaiyun.com/h1063135843/article/details/107841651
2021-09-02 10:13:21
248
原创 MOCO、SimCLR、MOCO2、BYOL
自监督经典论文MOCO在MOCO之前,对比学习的方式有两种。(a)需要两个encoder计算正样本q和负样本k,这依赖于大batchsize,并且需要两边梯度回传。(b)memory bank的方式,将所有负样本存在bank中,每次计算loss时只需要计算正样本q,不需要更新负样本。但是问题很明显,负样本的映射方式f(x)是一尘不变的,而正样本encoder是一直更新。这导致两边差距越来越大。MOCO提出了一种新的方式,原来数据结构也可以应用到深度学习。亮点如下:(1)MOCO是带有正样本和负
2021-07-05 10:08:48
1271
原创 反卷积尺寸的计算
https://blog.youkuaiyun.com/qq_27261889/article/details/86304061
2021-04-18 14:28:56
225
原创 pyttsx3 中文朗读问题
我的问题发生在TX2上,不能朗读中文在初始化engine后加一句engin.setproperty(’vioce’,‘zh)
2021-03-15 19:14:23
1674
3
原创 pyttsx3 libespeak.so.1: cannot open shared object file
sudo apt-get install espeak
2021-03-09 11:22:12
668
原创 conda 可用镜像源
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
2021-02-17 17:53:23
1148
原创 pytorch获取中间层
https://www.zhihu.com/question/68384370使用hook的方法也在链接里直接在前向传播加一句就可以,在model.train()后,直接调用就可以了
2021-02-17 11:08:01
239
原创 Output 0 of UnbindBackward is a view and is being modified inplace
出错原因,参考:https://blog.youkuaiyun.com/pearl8899/article/details/112185772。对于torch1.7,问题发生在utils.py,make_grid()函数中74行但是这个解决方法不适用torch utils.py,因为这个函数把range()这个内置函数占用了。所以修改为: for i, t in enumerate(tensor): # loop over mini-batch dimension norm_ra
2021-02-16 17:22:21
2137
2
原创 神奇的cyclegan!
什么是cyclegancyclegan在解决什么问题?在生成对抗网络中,有一个难点需要被关注。传统的GAN需要成对的数据训练,想要训练出一个结果,那么数据集必须要包含相对应的源域和目标域,如下图左侧:但是获取这些成对的数据是非常困难的,为了解决这个问题,cyclegan应运而生。现在我只有源于和目标域不成对的数据,如上图右侧,那么利用cyclegan也可以做到域的转换。原理整个cyclegan分三大模块对应三部分损失(代码是四部分,后续再说),生成器Gab由A域生成B域,生成Gba由B域生成A
2021-02-14 22:35:39
677
原创 Pyhton中extend()方法去掉二维List中的一列或者一行的妙用
https://blog.youkuaiyun.com/qq_31672701/article/details/100574277?utm_term=python%E5%88%A0%E9%99%A4%E5%88%97%E8%A1%A8%E4%B8%AD%E7%9A%84%E4%B8%80%E5%88%97&utm_medium=distribute.pc_aggpage_search_result.none-task-blog-2allsobaiduweb~default-0-100574277&spm
2021-02-04 22:36:48
480
原创 TX2 安装pycharm
对于jetpack4.3以下按照这个链接:https://blog.youkuaiyun.com/zt1091574181/article/details/88899668对于jetpack4.4:将上述面链接中openjdk-8-jdk改为openjdk-11-jdk如果你不幸安装错误,那么需要删除jdk重新安装删除链接 https://www.cnblogs.com/xiaoliu66007/p/7591214.html...
2021-02-02 19:11:49
325
1
原创 YOLOV5模型架构
模型架构是按照配置文件yaml进行搭建的。不同的版本的yaml在model文件夹中,每一版本的模型分为两个部分backbone和head。每一行代表了一个运算单元,这里按照YOLOV5结构图可以方便理解。每一行有四个参数,参数1:代表输入从运算单元获得,-1代表从上一个单元获得。参数2:代表该运算单元的重复次数。在yolov5中,不同版本就是控制操作单元的重复次数改变的。参数3:该操作单元的名字。参数4:输入的参数。为了方便理解,说明yaml文件中CONV=下图的CBL,C3=下图的CSP。mo
2021-02-01 20:03:02
3815
1
原创 python中eval()
eval(expression, globals=None, locals=None)eval相当于剥离出字符串引号中的运算,expression是输入的字符串,globals,locals是作用域,两个可以同时出现,优先级:local>lobal简单用法:https://blog.youkuaiyun.com/qq_29883591/article/details/53443062还有一种稍微复杂的方式:结果在定义了一个自函数后,将这个函数名字以字符串格式输入eval(),返回的结果就是一个实例化后
2021-02-01 18:54:49
230
1
原创 解决报错 OMP: Error #15: Initializing libiomp5md.dll, but found libiomp5md.dll already initialized
https://blog.youkuaiyun.com/weixin_41449637/article/details/108894809?utm_medium=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.control&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.
2021-01-30 10:59:14
2586
原创 Qt如何在其他cpp文件中控制MainWindow的控件(小白专用!!)
https://blog.youkuaiyun.com/qq_37668436/article/details/104143075?utm_medium=distribute.pc_relevant.none-task-blog-baidujs_title-6&spm=1001.2101.3001.4242
2021-01-11 15:49:39
1039
原创 win10 64位 QT5配置opencv环境(亲测成功)
前面编译过程要看下这个视频https://www.bilibili.com/video/BV1Za4y1v7ra?from=search&seid=8853456064479114255up主讲的很清楚,版本最好对应。但是最后在QT运行还是会报错,error: cannot find -llibopencv_world420.dlld我的解决办法是:(更换自己的路径)首先找到3部分文件,静态库(.lib文件),动态库(.a文件)(VS的为.dll),头文件。静态库文件位于通过CMAKE
2021-01-10 14:00:46
989
1
原创 python setup.py build develop编译出错 RuntimeError: Error compiling objects for extension
安装1.4pytorch 解决了
2021-01-05 10:42:40
7925
原创 在python中将多张图片合成为视频
https://blog.youkuaiyun.com/choumin/article/details/90319477?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1.control
2020-12-23 11:51:34
408
1
原创 Every Pixel Matters: Center-aware Feature Alignment for Domain Adaptive Object Detector
早上起来想到可以用全卷积的方式生成实例级的特征,在进行迁移。到实验室就看到了这篇文章,好巧。注意!!文章里的FC代表的全卷积不是全连接首先作者认为,图像级和实例迁移背景和噪声太多,损失太大。而基于中心区域的迁移会减少这种误差。作者使用anchor-free的检测框架作为检测pipeline。首先一个G(CNN)提取特征后进行一个图像级的迁移,然后经过P(全卷积FC)生成两个特征图,类别无关Mctr和类别相关Mcls。Mctr就是anchor-free检测框架下中对中心点的预测,Mcls是对像素
2020-12-14 11:36:54
764
3
原创 DETR
End-to-End Object Detection with Transformers论文地址:https://arxiv.org/pdf/2005.12872.pdf前面部分比较好理解,CNN提取特征送入transformer,输出n个box prediction,n代表了模型可以检测出物体最大的数目,是人为设定的。其中box包括了(类别,坐标)如何拜托NMS这种后处理呢,就是应用了二分匹配的原理。让预测出来n个box匹配实际的K个box,此时的n和K可能是不对等的,这样在匹配时就限制了n个
2020-12-09 09:58:42
338
原创 Consistency Regularization
原理很简单就是,当输入在很小变动情况下,网络的输出不应该存在变化。比如一个图像加了噪声前和加了噪声后对结果应该不产生影响。https://zhuanlan.zhihu.com/p/46893709
2020-11-27 18:29:04
728
原创 Adapting Object Detectors via Selective Cross-Domain Alignment
https://blog.youkuaiyun.com/qq_24548569/article/details/105017990
2020-11-27 13:45:31
146
原创 域自适应——Taking A Closer Look at Domain Shift: Category-level Adversaries for Semantics Consistent
以往的域适应方法中,只考虑的全局特征的对齐,会导致两个域的特征在某些情况出现负对齐。黄色箭头是源域数据在网络中的流向,蓝色是目标域。首先会经过权重共享层,输出两个像素级特征。为了保证这两个像素级特征是网络从不同的方向提取的,在这里引入了LOSS1:这个损失函数保证了两个输出是不同的。对于源域,特征1+特征2被当作网络的分割结果,这里有L2:还有一个域类判别器,它的输入是源域的特征1+特征2和目标域的特征1+特征2。对于目标域,需要维持两个特征的差值,作为局部对齐程度的依据,会产生一个loca.
2020-11-19 17:21:52
415
原创 RuntimeError: Input type (torch.cuda.FloatTensor) and weight type (torch.DoubleTensor) should be the
https://blog.youkuaiyun.com/jizhidexiaoming/article/details/82502280
2020-11-12 20:33:05
697
Desktop.zip
2020-06-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人