
计算机视觉
Jie Ou
学习
展开
-
【文章阅读】The Devil is in the Decoder【计算机视觉中的上采样方式-6种】
一、这是google的一篇探索的文章,探讨decoder结构的一篇文章二、主要贡献点 1、 探讨了不同的几种decoder的优劣,提出自己的上采样方案 2、 提出针对上采样的residual connection 3、 横向多任务对比各种不同方案三、不同结构decoder的对比TransposedConvolution:这个也是我们常说的“反卷...原创 2019-11-18 14:22:47 · 664 阅读 · 0 评论 -
【姿态估计文章阅读】PifPaf: Composite Fields for Human Pose Estimation
一、CVPR2019,内容上还是比较厉害的,代码:https://github.com/vita-epfl/openpifpaf二、主要思想 1、提出了Part Intensity Field (PIF)来提升heatmap在高分辨率下的精度 2、利用Part Association Field (PAF)来连接joints 3、本文方法主要...原创 2019-11-05 17:14:30 · 4202 阅读 · 0 评论 -
【姿态估计文章阅读】Single-Stage Multi-Person Pose Machines【依图科技】
一、今年ICCV2019刚出炉的文章,颜水成教授团队的,非官方代码:https://github.com/murdockhou/Single-Stage-Multi-person-Pose-Machines二、这篇文章核心思想 1、点评了下目前多人姿态估计中的现状:大多数人都在多two-stage,很多模型都是但人姿态估计结合上人体检测,这也是这两年的主要内容,效果虽然好,但是缺...原创 2019-11-04 15:07:13 · 3428 阅读 · 3 评论 -
【姿态估计文章阅读】Joint Training of a Convolutional Network and a Graphical Model for Human Pose Estimation
一、这是毫无疑问的大佬们的文章,2014年出就发布了第一版本,代码:https://github.com/max-andr/joint-cnn-mrf二、文章的核心思想 1、利用CNN做姿态估计,采用heatmap的方式来回归出关键点 2、利用人体关键点之间的结构关系,结合马尔科夫随机场的思想来优化预测结果,主要针对于网络预测的false postive。三...原创 2019-11-03 19:53:39 · 4552 阅读 · 3 评论 -
【姿态估计文章阅读】Human Pose Estimation with Iterative Error Feedback【这篇文章看的虽然有点迷糊,但是最后有一点很重要,自适应scale】
一、这是伯克利的大哥哥们在2016年发的一篇文章,也算是CNN的姿态估计,上升比较快的那几年。二、其实核心思想很像GBDT,一步步的去拟合残差。但是,不一样肯定是不一样的!放一张好看的图,GBDT的。 主要贡献: 1、提出一种自我修正的模型 2、传统模型映射是建立在“从in...原创 2019-11-01 18:08:40 · 1208 阅读 · 1 评论 -
【姿态估计文章阅读】Efficient Object Localization Using Convolutional Networks【大佬文,每一个实验都值得一看】
一、这是大佬们的一篇文章,算是比较早的利用CNN预测heatmap来做姿态估计的文章,上传时间2015年。二、这篇文章的核心思想: 1、pooling层能为网络增强一些“局部不变性”、“旋转不变性”之类的能力,也能降低参数等种种优点的同时对于回归heatmap的任务却会带来location的精度损失。因此提出了一种新的结构,用于弥补pooling的负效应,“position r...原创 2019-11-01 16:06:22 · 2312 阅读 · 3 评论 -
【姿态估计论文阅读】Multi-Scale Structure-Aware Network for Human Pose Estimation
前言:这是ECCV2018的文章,也是MPII目前的top 结果。这篇文章,用了很多“中继监督",本文的主要思想是结合“多尺度信息”,把这个体现到loss中,并且对多尺度信息进行结合,利用这一点来提升feature 效果。同时也引入了人体的结构信息,不像以前都是单个keypoint的heatmap 单独预测,本文还预测一种关联heatmap。还提出了一种keypoint的m...原创 2019-01-22 16:48:53 · 1577 阅读 · 1 评论 -
【目标检测】【数据增广】Data Augmentation For Object Detection
这是一个大佬在github 开源的项目,专门针对“目标检测”的“数据增广”!代码地址:https://github.com/Paperspace/DataAugmentationForObjectDetection博客地址:https://blog.paperspace.com/data-augmentation-for-bounding-boxes/如果我这样侵权了,请联系我删除!!...翻译 2019-01-23 16:17:44 · 7240 阅读 · 10 评论 -
CrowdPose: Efficient Crowded Scenes Pose Estimation and A New Benchmark 论文阅读
一、这是Alphapose的最新工作 特点,针对的是 “ crowd”场景下的多人姿态估计。 相对于以往的一些多人姿态估计工作而言,基本上都是不合适应用在“Crowd”场景之下的,比如Mask-RCNN训练的时候,会直接去除数据中的“Crowd”数据(MSCOCO)有这个标签,MPII没有这个标签。 ...原创 2019-03-06 15:57:50 · 1935 阅读 · 0 评论 -
【论文阅读-目标检测】Feature Selective Anchor-Free Module for Single-Shot Object Detection
这篇文章从视觉效果上来说,很大程度的提升了“小目标的”检测效果。一、主要内容这篇文章主要是针对FPN这种结构去做优化的,主要的优化点在于“如何去选择哪一层来回归目标”。以往的方法基本上都是基于“Heuristic feature selection” 以及 “overlap-based anchor sampling”“Heuristic feature s...原创 2019-04-11 15:23:24 · 2634 阅读 · 1 评论 -
【论文阅读】Does Learning Specific Features for Related Parts Help Human Pose Estimation?
一、CVPR2019二、主要思想 目前几乎所有的pose 网络,针对“单人姿态估计网络”,几乎都是共享全部feature 的。这个的意思从代码上来理解就是,在最后一层 1*1的那个卷积层 一次性输出所有需要预测的 joint,他们的输入都是相同的。 这篇文章的作者,这里这样做是不合理的,并不是所有的关键点都是需要共享 high-level representa...原创 2019-06-17 16:33:52 · 1882 阅读 · 8 评论 -
【论问阅读】VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION
一、 这篇文章,论文写的读起来很舒服,实验做的非常细,以前一直没看,看了之后发现,现在用的很多方法,都是人家玩剩下的。二、主要内容 探索更深的网络、探索小卷积核3x3、探索比对训练与测试三、VGG主要架构 基本上我们只知道VGG有两个模型,16层和19层...原创 2019-06-18 14:56:18 · 406 阅读 · 0 评论 -
【图像分割综述】 Image Segmentation Review 【代码总汇】code
前言:在目前的应用中,图像分割可以分为以下几大类 1、自动驾驶领域-车道线分割,车道分割,instance分割等 2、普通图像 - 基于类别的图像分割/基于instance的图像分割 3、医学图像 - 2/3D 图像分割,通常是非instance的 图像分割、姿态估计、目标检测 在 卷积神经网络...原创 2019-01-17 11:21:52 · 2453 阅读 · 0 评论 -
【医疗图像分割】Deep neural networks for the detection and segmentation of the retinal fluid in OCT images.
题目:Deep neural networks for the detection and segmentation of the retinal fluid in OCT images. 背景介绍:这依然是一篇MICAI 2017的文章,来自于MICAI2017的workshop挑战赛,Retouch Challenge 2017.关于比赛内容以及比赛结果等信息可以点积这个...原创 2019-01-21 10:36:56 · 1014 阅读 · 0 评论 -
【计算机视觉】-图像二值化 - 图像分割 -图像卷积
图像卷积:利用2D卷积核去扫图像,主要是为了实现Blur,高斯滤波本质也是通过卷积来实现的,只不过他的卷积核内参数是符合高斯分布的。图像二值化:图像二值化之后为黑白图像,相当于mask掩模,用于挖出图像中的非规则感兴趣ROI区域。图像分割:本文主要说的是传统方法的分割,主要是基于灰度图像的直方图统计,选取阈值,进行分割。实现:我们会用到的工具有 python ,matplotlib,o...原创 2018-12-05 21:30:22 · 5352 阅读 · 0 评论 -
【人体姿态追踪】Pose Flow: Efficient Online Pose Tracking 【解读】
工作组:上交卢老师团队发表处:BMVC开源代码:https://github.com/YuliangXiu/PoseFlow参考博客:https://blog.youkuaiyun.com/m0_37644085/article/details/83038566,https://blog.youkuaiyun.com/zhangjunhit/article/details/79524796特别说明:如...原创 2018-12-13 16:02:36 · 7877 阅读 · 6 评论 -
【深度学习总结】【深度学习-2018-年度总结】【计算机视觉】【预训练模型库】【神经网络技巧】【高性能计算】【人工智能】
时间:2018/12/20深度学习热潮:4年深度学习框架: 图片来源:http://m.elecfans.com/article/798648.html Pytorch可以说是用户数量提升最快的一个框架,上图来自于某位大佬的博客,时间节点2018年9月。现在pytorc...原创 2018-12-21 11:18:09 · 379 阅读 · 0 评论 -
【深度学习总结】【深度学习-2018-年度总结】【计算机视觉】【预训练模型库】【神经网络技巧】【高性能计算】【人工智能】
【2018-新概念-深度学习-年度总结】:一、RFB模块文章地址:https://arxiv.org/abs/1711.07767 CVPR2017,虽然是2017年的,但是我还是要说代码地址:https://github.com/ruinmessi/RFBNet推荐代码地址:https://github.com/lzx1413/PytorchSSD核心思想:1、模仿人...原创 2018-12-21 11:17:29 · 721 阅读 · 0 评论 -
【single stage 多人姿态估计】Associative Embedding: End-to-End Learning for Joint Detection and Grouping
出处:NIPS2017核心内容:Single Stage 多人姿态估计文章摘要:这篇文章,提出了一个与之前所有方法都不一样的新的姿态估计方法,也可以用于instance 分割,目标检测等。这个方法是自下而上的,在此之前比较有名的自下而上的姿态估计领域的文章,是“OpenPose”-CMU。核心思想:先检测全图所有的关键点,如果是COCO数据集那么Heatmaps就有17+1个,如果...原创 2018-12-20 15:18:12 · 1773 阅读 · 0 评论 -
【SSD修改输入尺寸】how to change SSD input size?SSD640/BRFSSD_640
再也不局限于SSD300 和SSD512这两个版本了!!!BRFSSD_vgg实现修改input size!!!1、首先准备好一份SSD代码推荐使用:https://github.com/lzx1413/PytorchSSD框架:pytorch0.4.0运行遇到报错:关于Sample.py 下面什么说东西不能放在gpu之类的。进行如下修改anaconda3/envs/pyt...原创 2018-12-23 21:35:07 · 5704 阅读 · 21 评论 -
【Focal Loss】简单理解 及 Pytorch 代码 Focal Loss for Dense Object Detection
一、首先回顾下“交叉熵loss Cross Entropy Loss” CE(Pi)=-log(Pi)二、一般地说,我们数据集会存在类别不平衡问题,很多人会在loss上对应不同类别设置不同系数 loss就变成了上面的样子三、Focal loss其实就是通过数学公式上的改变,扩大了不平衡因素在loss上的影响...原创 2019-01-10 17:19:25 · 7075 阅读 · 6 评论 -
修改中。。。。【AIChallenger 2018 】【眼底水肿病变区域分割】冠军解决方案
内容完善中。。。赛道:眼底水肿病变区域分割队名:965728310比赛地址:https://challenger.ai/competition/fl2018,答辩视频地址可关注官网最新动态特别说明:未经作者同意以下内容请勿转载,或挪作他用!如果一下图片内容存在侵权,请及时联系作者删除!代码:后期更新题目内容:对OCT图像中,水肿类型进行多分类,且对病变区域进行分割 ...原创 2018-12-25 20:57:32 · 2560 阅读 · 20 评论 -
【医疗图像分割】【MICAI RETOUCH CHALLENGE 2017】 Simultaneous Detection and Quantification of Retinal Fluid wi
前言:今天我们要解读的这篇文章,是深度卷积神经网络在医学图像上的应用,关于计算机CV应用于Medical这个领域已经有长达几十年的历史了。MICAI也算是这方面的顶会了,retouch challenger也是2017年MICAI的workshop,https://retouch.grand-challenge.org/ 。当然这个数据集目前也是下载不到了,如果有小伙伴能够弄到...原创 2019-01-20 15:00:24 · 2257 阅读 · 21 评论 -
【医疗图像分割】【MICAI RETOUH 2017】Simultaneous Classification and Segmentation of Cysts inRetinal OCT
题目:Simultaneous Classification and Segmentation of Cysts in Retinal OCT前言:这篇文章,给出了一种新的U型CNN,可以同时给出分割以及检测结果,而且工作的意义在于,可以量化的给出患者OCT影像结果。关于数据集以及这个挑战赛的介绍可以看这篇博客https://blog.youkuaiyun.com/github_36923418/ar...原创 2019-01-20 17:00:19 · 914 阅读 · 0 评论 -
【深度学习-计算机视觉】【视觉算法岗位,公司有哪些?】浅谈当下“互联网寒冬”,为何都说算法岗越来越难找?
为什么要谈这个:再过几个月就是“春招”,虽然三月份还没到,但是已经火药味十足,各大企业已经开始招收实习生,并且给出了不少转正名额!当下在硕士生圈流传着一句话“大厂实习经历抵得上一篇论文!”,让不少因“种种原因”不能去实习的小伙伴,面红耳赤,两字“上火!!!”。但是不无道理,人家去实习了,相当于去“展示自己的才艺”,展示的好自然可以留下来,不好也算是个经历!开门见山-说一说目前国内有哪些可以去的...原创 2019-01-10 00:27:04 · 4567 阅读 · 2 评论 -
【计算机视觉】- 如何计算灰度图像 【python 灰度图像】
图像类型:通常我们的数字图像是彩色的3通道RGB图像,R代表红色,G代表绿色,B代表蓝色。存储方式:通常是uint8 无符号整数,0~255,当然也有24bits 可以表示更多的颜色,虽然这样做可以提高图像对于现实世界的一个还原度,但是会增加更多的开销,因此我们通常还是用8bits灰度图像:灰度图像在图像处理种有着非常重要的地位,一些常用的操作都会涉及到灰度图像的转换,边缘检测、二值化等这...原创 2018-12-05 15:39:12 · 7332 阅读 · 0 评论