jingwenlai 2018-8-15
# 简介 & 主要贡献
Tiramisu - FC-DenseNet (https://arxiv.org/abs/1611.09326),
经典的semantic image segmentation的方法基于CNN,主要包含3个组件:
(a) 一个downsampling path,主要用来提取特征
(b) 一个upsampling path,被训练用来在输出结果中逐步恢复输入精度
(c) 可选地,一个后处理模块(如Conditional Radom Fields)来优化模型输出。
经典的U-Net即是这种结构。
DenseNet在图像分类中获得了非常优异的结果,其结构更精准且更易于训练。
FC-DenseNet在无预训练及后处理的情况下,在CamVid, Catech数据集上获得了state-of-the-art的结果。并且,该结构含更少的参数,且易于训练。
Code& Experiments: https://github.com/SimJeg/FC-DenseNet/blob/master/train.py
A GOOD alternative implementation(pyTorch) & Explanation: https://github.com/bfortuner/pytorch_tiramisu
# 实现思路及方法

本文是关于FC-DenseNet在语义图像分割领域的研究笔记,探讨了FC-DenseNet如何结合DenseNet的优点,通过密集块和上采样操作在不需要预训练和后处理的情况下取得State-of-the-Art结果。FC-DenseNet结构深但参数少,有效地解决了特征映射爆炸问题。训练策略包括像素级交叉熵损失、初始化、RMSprop优化器和数据增强。实验证明,FC-DenseNet在CamVid和Gatech数据集上表现优秀。
最低0.47元/天 解锁文章
1984

被折叠的 条评论
为什么被折叠?



