
计算机视觉
文章平均质量分 51
Wanderist_ZK
微信小程序:论文快看
微信公众号:深度学习与推荐系统
展开
-
【计算机视觉英文名词笔记】
ROI: Region of InterestOHEM:Online Hard Example Mining原创 2018-05-25 14:57:33 · 791 阅读 · 0 评论 -
关于深度学习中feature map的分辨率,卷积感受野和attention的理解
1.一般情况下,AI深度学习的任务会有要求分类的,对象检测的,关键点检测的,但这些任务都需要网络既有提取细节信息的能力,又具有大感受野的能力。2.比如FashionAI的服饰属性分类,既需要网络能提取细节信息(领口,袖口等),也就是要求feature map的分辨率高,又需要网络具有大的感受野,能看到全局(比如长裤等),但是一般通过堆叠卷积操作,让感受野增大后,feature map的分辨率又...原创 2019-03-12 10:48:45 · 2836 阅读 · 0 评论 -
anaconda利用conda命令搭建python虚拟环境(python3.6为例),附带pytorch环境搭建,添加conda清华源,pip清华源
1.先安装anaconda安装包,Python3.6版本的2.然后运用conda命令新建一个python虚拟环境,conda create -n [name] python=3.6 -y ,这样就新建了一个名字为name 的Python虚拟环境3.然后对虚拟环境进行激活,命令为 source activate name在这里python虚拟环境就新建成功啦4.添加conda,pip...原创 2019-01-11 20:21:06 · 11524 阅读 · 0 评论 -
Kaggle Whale Shark Recognition 比赛途中经验总结
在准备这个比赛的过程中感觉学到了不少,现在总结一下:经过好几次的比赛与论文写作经历,个人认为比赛和写论文做实验最大的一个区别就是:论文中所引用的都是标准数据集,一般数据集质量高,而比赛中的数据集噪声就比较大,比如,拿到这个比赛的数据集,我们可以看到里面即有黑白图,又有彩色图,既有带文字的图片,又有没带文字的,并且有的zoom比较大,有的zoon比较小,最重要的也是这个比赛的核心难题(挑战)就是...原创 2019-01-02 10:44:02 · 366 阅读 · 0 评论 -
把Cascade Pyramid Network网络应用到天池FashionAI 服装关键点数据集上的经验总结
1.首先最明确的一点就是修改需要检测关键点的个数,COCO数据集姿态识别的关键点个数是17,而FashionAI数据集的总个数是24个,但是不同的服装类别的个数不一样,比如blouse有13个点,但是如果生成24个heatmap,就会至少有11个heatmap是没用的,这样导致GPU内存增大,又使得loss不能很好的传递训练,因此最好分别对每个单类别进行训练2.测评要求不一样,FashionA...原创 2018-12-07 17:25:52 · 1344 阅读 · 2 评论 -
复现和改进Cascade Pyramid Network(CPN)时总结的经验和心得
1.由于该网络是多任务训练,分别对难检测点和易检测点进行了loss 计算,同时采用了Feature Pyramid Network(FPN)主结构(U-shape)提取特征,因此训练时间比较长,当我对该网络进行了改进时,发现完整从头训练一次需要24~26个epoch,而一个epoch就需要3个半小时,耗时特别长,因此把开始的学习率从0.0001调到了0.0005,缩短了训练时间,赶论文所迫,总共有...原创 2018-11-07 09:53:57 · 1755 阅读 · 8 评论 -
dilated conv空洞卷积操作的神奇作用
简单描述,通过空洞卷积可以在保持卷积核参数大小不变的同时,增大卷积的视野。除此之外,在进行空洞卷积前,通过双线性插值,对feature map进行上采样之后,再进行空洞卷积,这样可以在提高feature map的像素的同时,提取更多的全局进行。一些常见下采样的操作:maxpooling;conv 3*3,same padding,stride=2;开了一个技术交流的公众号,里面记录一...原创 2018-11-06 21:41:55 · 4354 阅读 · 0 评论 -
【姿态识别】Convolutional Pose Machines—亮点总结与学习
1.利用每个关键点的响应图(即平面上的点的数值满足正态分布,可以画出三维高斯图)来表达各个部位的空间约束,相当于把点的回归转化成面的回归,减少误差。同时论文中把中心点的响应也作为网络的输入,用来做中心约束。2.由于论文中提出的网络是分阶段的,因此在训练的时候,如果只用最后一阶段的的输出和label计算loss会使得梯度回传到上一阶段出现梯度弥散的现象,因此论文中提出中继监督优化,即在每一阶段的...原创 2018-10-16 10:10:47 · 1201 阅读 · 0 评论 -
YOLO算法理解与思考
看完YOLO算法后,觉得真的是非常棒的一个对象检测算法。最主要的亮点是他的检测速度快,这和其中的只用一次卷积提取特征有关,也就是说,该算法不是先对图像进行区域划分再进行卷积提特征分类,而是一个端到端的一次性的回归出bounding box和classification,即输出 n * n * 8个参数(假设对象有3类)。Pc:是否有对象,bx:对象中心点的x坐标(小于1),by:对象中心点的y...原创 2018-10-12 20:53:09 · 2158 阅读 · 0 评论 -
总结CNN的发展历程,以及一些卷积操作的变形,附带基础的深度学习知识与公式
1.Lenet-5 :最先出现的卷积神经网络,1998年,由于当时的硬件还不成熟,因此到了2012年出现了AlexNet2.AlexNet:可以说是现在卷积神经网络的雏形3.VGGNet:五个模块的卷积叠加,网络结构如下: 4.GoogleNet:inception v1,v2,v3, xception,基本思想就是对feature map用不同的卷积核filter进行卷积,...原创 2018-10-01 14:13:15 · 1500 阅读 · 0 评论