
语义分割文献笔记
旋涡小林
这个作者很懒,什么都没留下…
展开
-
论文阅读:MobileNetV2: Inverted Residuals and Linear Bottlenecks(MobileNetV2)
文章目录1 摘要2 存在问题3 亮点3.1 Linear Bottlenecks3.2 Inverted residual block3.4 总的结构体4 部分结果4.1 部分数据对比4.2 部分效果对比5 结论5.1 优势5.2 不足6 参考资料1 摘要本文基于MobileNetV1(戳这可以先了解一下MobileNetV1)的缺陷提出了MobileNetV2结构,并且详尽地分析介绍了...原创 2020-03-12 15:50:01 · 682 阅读 · 0 评论 -
论文阅读:Large Kernel Matters —— Improve Semantic Segmentation by Global Convolutional Network(GCN)
文章目录1 摘要2 存在问题3 亮点3.1 GCN模块3.2 边界提取模块(BR模块)3.3 总的网络框图3.4 ResNet50-GCN预训练模型4 部分结果4.1 部分数据对比4.2 部分效果对比5 结论5.1 优势5.2 不足6 参考资料1 摘要文章指出,最近流行的一个趋势就是使用小的过滤器进行堆叠(如:1x1,3x3等),这样能够在同样的计算量情况下比大的过滤器更有效率。然而,作者发现...原创 2020-03-10 22:38:07 · 1290 阅读 · 0 评论 -
论文阅读:MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications
文章目录1 摘要2 存在问题3 亮点3.1 深度可分离卷积3.2 α宽度乘法器和ρ分辨率乘法器3.2.1 α宽度乘法器3.2.2 ρ分辨率乘法器3.3 网络整体结构4 部分结果4.1 部分数据对比4.2 部分效果对比5 结论5.1 优势5.2 不足6 参考资料1 摘要本文针对嵌入式视觉应用领域,提出一个新颖的MobileNets网络,该网络使用了深度可分离卷积使得其网络结构十分轻量,并且,可以...原创 2020-03-06 22:51:34 · 891 阅读 · 2 评论 -
论文阅读:SEMANTIC IMAGE SEGMENTATION WITH DEEP CONVOLUTIONAL NETS AND FULLY CONNECTED CRFS(DeepLabV1)
文章目录1 摘要2 存在的问题3 亮点3.1 引入空洞卷积3.2 引入CRF处理3.3 考虑多尺度处理3.4 总体的结构4 部分结果4.1 分割的数据对比4.2 分割的效果对比5 结论5.1 优势5.2 不足6 参考资料1 摘要深度卷积神经网络(DCNNs)在视觉任务中应用广泛,但是在语义分割中,使用DCNNs的最后一层进行预测存在分割定位不准备的问题。针对这个问题,作者结合DCNNs和CRF...原创 2020-03-01 22:46:47 · 580 阅读 · 0 评论 -
论文阅读:Rethinking Atrous Convolution for Semantic Image Segmentation(DeepLabV3)
文章目录1 摘要2 存在的问题2.1 解决多尺度问题常用的四个方法2.2 空洞卷积的缺点3 亮点3.1 output_stride的影响3.2 ASPP改进4 部分结果4.1 分割的数据对比4.2 分割的效果对比5 结论5.1 优势5.2 不足6 参考资料1 摘要目前语义分割过程存在两个问题:① 池化层导致图像分辨率的下降; ② 图像的多尺度问题。针对这两个问题,而在DeepLabV2中,作者...原创 2020-02-27 22:30:11 · 887 阅读 · 0 评论 -
论文阅读:Learning to Segment Object Candidates(DeepMask)
文章目录1 摘要2 亮点2.1 DeepMask结构2.2 损失函数3 部分结果3.1 与其它网络的对比3.1 分割效果4 结论4.1 优势4.2 不足5 参考资料1 摘要最近目标检测一般需要依赖于2个关键步骤:(1)尽可能有效率地提取目标proposals。(2)对提取到地这些proposals进行分类。与上面的不同,作者提出一个新网络结构DeepMask:通过一个网络分成两条不同路径,一条...原创 2020-02-23 12:37:36 · 1361 阅读 · 1 评论 -
论文阅读:LSTM-CF: Unifying Context Modeling and Fusion with LSTMs for RGB-D Scene Labeling
文章目录1 摘要2 亮点2.1 LSTM-CF网络总体思路2.2 LSTM-CF网络总体结构3 部分效果3.1 LSTM-CF网络各模块的影响3.2 分割效果4 结论5 参考资料1 摘要(如果之前没有了解过RNN处理语义分割任务时,建议先看这篇文章:论文笔记:ReNet: A Recurrent Neural Network Based Alternative to Convolutional...原创 2020-02-22 22:07:49 · 1061 阅读 · 0 评论 -
论文阅读:ReSeg: A Recurrent Neural Network-based Model for Semantic Segmentation
文章目录1 摘要2 亮点2.1 ReNet结构改进2.2 ReSeg整体结构3 效果4 结论5 参考资料1 摘要本文基于ReNet提出ReSeg网络,ReSeg网络的特征提取阶段(编码器阶段)采用的是预训练好的CNN网络结构,而在恢复图像尺寸的时候(解码器阶段,也就是上采样阶段)采用了RNN结构,RNN结构部分是基于ReNet的,ReNet是基于RNN的图像分类网络。ReSeg结构处理语义分割...原创 2020-02-21 18:52:01 · 1728 阅读 · 0 评论 -
论文阅读:ReNet: A Recurrent Neural Network Based Alternative to Convolutional Networks
文章目录1 摘要2 亮点2.1 使用RNN处理图像2.2 ReNet总体结构3 效果4 结论5 参考资料1 摘要本文提出一个叫ReNet的深度神经网络结构用于目标识别,该网络使用RNN代替了大部分的卷积+池化操作部分,通过使用RNN单元对图像块进行横向扫描、垂直扫描得到两个特征图再进行拼接。该网络在MNIST、CIFAR-10、SVHN数据集均有较好的表现。2 亮点2.1 使用RNN处理图...原创 2020-03-02 23:53:02 · 3951 阅读 · 0 评论 -
论文阅读:Learning Deconvolution Network for Semantic Segmentation
文章目录1 摘要2 亮点2.1 解码器结构2.1.1 反池化层2.1.2 反卷积层2.1.3 反池化和反卷积结合2.2 网络整体结构3 部分效果3.1 FCN和DeconvNet的对比3.2 各个网络效果对比4 结论5 参考文献1 摘要针对单纯的FCN网络存在忽略小物体、分解大物体的问题,当时通常地做法是使用CRF做后处理进行对分割结果进行调整。而本文提出了DeconvNet,该网络可以拆解成...原创 2020-02-20 11:51:43 · 916 阅读 · 0 评论 -
论文阅读:RefineNet: Multi-Path Refinement Networks for High-Resolution Semantic Segmentation
文章目录1 摘要2 亮点2.1 残差卷积模块(RCU)2.2 多分辨率融合模块(MRF)2.3 串联残差池化模块(CRP)2.4 RefineNet模块结构2.5 RefineNet整体网络结构2.6 RefineNet变种结构3 部分效果4 结论5 参考文献1 摘要随着CNN的不断发展,涌现了很多深度较深的CNN如ResNet系列,它们非常适合用于完成稠密分割任务,如语义分割。但是由于CNN...原创 2020-03-02 23:54:03 · 1677 阅读 · 0 评论 -
论文阅读:ParseNet: Looking Wider to See Better
文章目录1 摘要2 亮点2.1 全局池化层2.2 L2归一化层2.3 ParseNet总体结构3 部分效果图4 结论5 参考文献1 摘要针对FCN的实际感受野比理论感受野小很多的问题——按道理VGG+FCN的fc7的感受野是404×404,可实际上的FCN的fc7的感受野却并没有这么大,本文提出一种ParseNet网络,通过融合全局信息来弥补实际感受野的不足。2 亮点2.1 全局池化层作...原创 2020-02-19 11:12:34 · 1241 阅读 · 2 评论 -
论文阅读:ENet: A Deep Neural Network Architecture for Real-Time Semantic Segmentation
文章目录1 摘要2 亮点2.1 initial模块和bottlebeck模块2.1.1 initial模块2.1.2 bottlebeck模块2.2 PReLU2.3 普通卷积、非对称卷积、空洞卷积混合使用2.4 ENet总体结构3 效果4 结论5 参考资料1 摘要语义分割的落地(应用于嵌入式设备如手机、可穿戴设备等低功耗移动设备)是一个很重要的问题,而最近提出的网络中,虽然有着较高的准确率,...原创 2020-02-17 14:00:18 · 1628 阅读 · 0 评论 -
论文阅读:Pyramid Scene Parsing Network
文章目录1 摘要2 亮点2.1 PSPNet2.2 ResNet的辅助loss3 部分效果4 结论5 参考文献1 摘要本文针对场景解析提出一种使用金字塔池化模块的PSPNet,能够聚合不同区域的上下文信息,在场景解析中达到非常好的效果,该结构在各个数据集中均有很好的表现,其中在PASCAL VOC 2012和Cityscapes中刷新了mIoU的记录,分别获得85.4%和80.2%的准确率。...原创 2020-02-15 23:02:41 · 1228 阅读 · 1 评论 -
论文阅读:DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution,and......
文章目录1 摘要2 亮点2.1 空洞卷积2.2 空洞空间金字塔池化(ASPP)2.3 条件随机场(CRF)3 效果4 结论5 参考文献1 摘要本文提出了一种用于语义分割的DeepLab系统,主要有三大贡献:① 使用“空洞卷积”代替传统的普通卷积;② 提出空洞空间金字塔池化(ASPP)有效地解决图像多尺度问题;③ 使用条件随机场(CRF)对特征图进行后处理,解决了图像边界定位,分割不准确地问题。...原创 2020-03-02 23:54:37 · 1519 阅读 · 0 评论 -
论文阅读:SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation
文章目录1 摘要2 亮点2.1 网络结构2.1.1 编码器结构2.1.2 解码器结构3 效果4 结论5 参考资料1 摘要本文提出一种可用于端到端训练的语义分割网络结构——SegNet,它是一种编码器—解码器结构。编码器结构类似于VGG16的前13层,而本文的重点介绍在于解码器部分,其创新性地使用了一种池化索引的上采样方法,不仅消耗更小的内存,而且在上采样部分避免了学习。该网络主要运用于道路场景...原创 2020-02-14 20:54:22 · 1908 阅读 · 0 评论 -
论文阅读:U-Net: Convolutional Networks for Biomedical Image Segmentation
文章目录1 摘要2 亮点2.1 数据增强2.2 U-Net网络结构2.2.1 裁剪2.2.2 特征的拼接2.2.3 U-Net总体结构的分析3 效果4 结论5 参考文献1 摘要针对医学图像分割领域,本文作者提出一种数据增强的策略和一种U-Net网络结构,该结构通过端到端的训练能够使用少量的图像而得到比当时滑动窗口法(普通CNN)更好的效果。并且,该网络非常快,使用普通GPU分割一张512x51...原创 2020-03-02 23:53:37 · 1340 阅读 · 0 评论 -
论文阅读:Fully Convolutional Networks for Semantic Segmentation
文章目录1 摘要2 创新点2.1 以全卷积层代替全连接层2.1.1 支持任意不同尺寸图片的输入2.1.2 更利于端到端学习2.2 使用“反卷积”作为上采样2.3 引入了跳跃结构3 效果4 结论5 参考文献1 摘要针对语义分割,本文提出一种叫“fully convolutional networks”的网络(下称FCN),该网络支持输入任意尺寸的图片并且输出一定尺寸的图片。在这个网络中定义了一种...原创 2020-02-12 12:38:22 · 1154 阅读 · 0 评论