- 博客(23)
- 收藏
- 关注
原创 CV领域常用词及其含义
CV领域常用词及其含义一、backbone二、head三、neck四、bottleneck五、GAP六、embedding七、pretext task和downstream task八、warm up九、end to end一、backbone在神经网络中,尤其是CV领域,一般先对图像进行特征提取(常见的有vggnet,resnet,inception等等),这一部分是整个CV任务的根基,因为后续的下游任务都是基于提取出来的图像特征去做文章(比如分类,生成等等)。所以将这一部分网络结构称为backbon
2022-05-16 21:03:17
2329
原创 Transformer万字详解
Vision Transformer一、Transformer起源(李宏毅)1.self-attention一、Transformer起源(李宏毅)1.self-attention现实中有很多情况需要把a set of vectors(may change length)作为输入,比如一段英文“this is a cat”,可以把其进行one-hot encoding(独热编码)也可以对其进行word embedding(给每个词一个向量,这个向量有语义的信息,比如说把word embedding画出
2022-05-16 16:53:34
1161
原创 RoI Pooling 和 RoI Align
RoI Pooling 和 RoI Align一、基本概念一、基本概念RoI(Region of Interest)是通过不同区域选择方法,从原始图像(original image)得到的候选区域(proposal region)
2022-04-28 20:44:41
5179
2
原创 LSTM和GRU看完必须全部了然
LSTM和GRU的感性理解一、RNN的缺点——短时记忆二、LSTM1.整体结构一、RNN的缺点——短时记忆RNN 会受到短时记忆的影响。如果一条序列足够长,那它们将很难将信息从较早的时间步传送到后面的时间步。 因此,如果你正在尝试处理一段文本进行预测,RNN 可能从一开始就会遗漏重要信息。在反向传播期间,RNN 会面临梯度消失的问题。 梯度是用于更新神经网络的权重值,消失的梯度问题是当梯度随着时间的推移传播时梯度下降,如果梯度值变得非常小,就不会继续学习。因此,在递归神经网络中,获得小梯度更新的层
2022-04-08 20:39:49
1173
原创 如何写一篇优质论文
阅读笔记一、如何写论文1.整体行文思想(1)列出提纲和实现计划(2)格式要排好(3)用reviewer的视角去写文章2.每个部分应该怎么写(1)给文章取个好名字(2)摘要和关键词(3)引言(4)材料与方法(5)实验结果3.具体写作语言(1)学术写作常用词组与句式(2)SCI写作常用句式总结二、整体行文逻辑1.writing is first2.identify your key idea3.tell a story4.nail your contributions to the mast(Introduct
2022-04-08 10:35:15
1464
原创 linux下的各种小问题们
开个新的文档,linux(ubuntu)中遇到的各种小问题都放到这里面1.怎么启动没有pycharm快捷键的pycharm进入pycharm安装路径下的bin目录下,找到pycharm.sh文件,然后打开终端,输入命令:./pycharm.sh
2022-03-08 16:09:38
886
原创 PPDM原文阅读笔记
目录一、概述二、详细说明1.传统HOI检测简介2.PPDM简介(1)提出了新的一阶段HOI监测框架(2)建立了一个更加偏向应用的HOI-A数据集3.PPDM详细介绍(1)总体流程图(2)点检测分支<1>定义变量<2>计算point location loss<3>计算size and offset loss(3)点匹配分支<1>定义变量<2>计算displacement loss<3>Triplet matching(4)Loss an
2021-12-10 15:49:30
4052
3
原创 在Colab上复现TSN
目录一、Colab简介和使用说明1.Colab简介2.Colab使用说明2.1两种使用方式2.1.1连接谷歌云盘2.1.2不连接谷歌云盘2.2具体使用细节2.2.1GPU设置2.2.2程序管理2.2.3具体编程二、TSN代码复现1.数据集准备和处理1.1数据集下载1.2数据集处理一、Colab简介和使用说明1.Colab简介colab是谷歌的一个线上深度学习训练平台,对于刚进实验室还没分配到工作站的研究生非常之友好。但是分配到工作站以后,不管是算力还是金钱还是方便程度,还是工作站香。网址: http
2021-11-12 15:53:05
2046
1
原创 ResNet原文阅读笔记
文章目录一、ResNet解决的问题一、ResNet解决的问题按常人思维来看,深的深度学习网络虽然会,应该越深性能越好,然而这几个作者却发现事实并不是那么简单。如下图所示,不管是在训练集还是测试集,56层深的网络都比20层深的网络训练结果差。...
2021-11-04 21:17:00
1651
转载 解决Chrome搜索时报错ERR_EMPTY_RESPONSE(自用)
以管理员身份打开cmd依次输入ipconfig /releaseipconfig /allipconfig /flushdnsipconfig /renewnetsh int ip set dnsnetsh winsock reset然后重启电脑就OK了
2021-11-02 19:55:41
2878
原创 python补充学习(未完成)
目录一、类基础1.初始化类2.实例属性13.实例属性24.类属性5.实例方法6.私有属性7.私有方法8.@classmethod方法19.@classmethod方法210.staticmethod方法11.property112.property213.类的继承14.子类方法的重构15.子类与父类的关系16.多态二、TSN补充学习0.argparse模块1.argparse模块12.argparse模块23.argparse模块34.argparse模块45.argparse模块56.argparse模块
2021-10-29 15:04:51
318
原创 TSN源码阅读
目录一、项目结构1.py文件解释2.函数组成及调用关系3.IPO图二、opts.py解读三、main.py解读四、models.py解读五、dataset.py解读瞎写八写在前第一次读代码,读了快一周了还是迷离迷糊的,不知道从哪读起,也不知道怎么debug,python学的感觉也用不到,用到的都是没学的。慢慢来把,争取下一周读完+能在工作站上跑一下UCF-101的数据集。上周日看了Randy教授的最后一课,感触最深的一段话是他说的遇到困难时候的态度,以前读到这种感觉就是鸡汤一看而过,当真正开始遇到这种
2021-10-29 15:03:43
2628
7
原创 TSN原文阅读笔记
文章目录一、补充知识1.Optical Flow2.two-stream(RGB图和光流混合起来判断)的缺点二、TSN介绍1.TSN大体模型介绍2.五种共识聚合函数(1)max pooling(2)average pooling(3)top-k pooling(4)weighted average(5)attention weighting3.四种不同输入4.三种改进训练的策略(1)交叉输入模式预训练(2)正则化技术(3)数据增强5.M-TWI(1)长视频分类的挑战(2)M-TWI方法五、优点与不足1.优点
2021-10-22 16:17:15
1680
原创 two-stream双流网络 知乎、优快云学习笔记
文章目录一、文章解决的问题二、论文细节1.双流网络的具体结构是什么2.两个网络怎么合并在一起3.optical flow(光流)是什么4.多任务学习怎么做5.Bi-directional optical flow(双向光流)6.优点和不足一、文章解决的问题1.提出了two-stream结构的CNN,由空间和时间两个维度的网络组成2.使用多帧的稠密光流场作为训练输入,可以提取动作的信息3.利用了多任务学习的方法把两个数据集联合起来二、论文细节1.双流网络的具体结构是什么该网络有两个独立的识别流
2021-10-22 16:07:39
8250
原创 动作识别概况
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mar
2021-10-22 15:58:32
9946
原创 CNN按钮报告
CNN按钮报告一、 不同激活函数对精度和Loss的影响两层卷积一层池化一层全连接(1)Relu:最终Loss为1.389(2)Sigmoid:最终Loss为4.851(3)Tanh:最终Loss为4.046(4)总结:Loss AccRelu 1.389 0.581Sigmoid 4.851 0.050Tanh 4.046 0.069可以看出在较为简单的网络模型中,使用relu作为激活函数,其效果与其他两个激活函数比起来是非常好的,而其他两种函数可能由于问题复杂且模型简单,效果都非
2021-10-15 18:44:10
691
原创 Pytorch听课笔记
一、pytorch数据类型1.pytorch数据类型Pytorch数据类型(CPU上的):torch.IntTensor,torch.FloatTensor,torch.ByteTensor(比较两种类型用)Pytorch数据类型(GPU上的):torch.cuda.IntTensor,torch.cuda.FloatTensor,torch.cuda.ByteTensor(比较两种类型用)表示string的话一般常用独热法(让结果与数值和string无关)2.Type check(类型检验,常用
2021-09-24 16:42:14
656
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人