多任务多领域学习与顺序标注的研究进展
在机器学习和计算机视觉领域,多任务多领域学习以及顺序标注是两个重要的研究方向。多任务多领域学习旨在利用多个相关但标注不同的数据集进行学习,而顺序标注则专注于对序列数据进行分类。下面将详细介绍这两个方向的研究内容和实验结果。
多任务多领域学习的语义分割实验
在多任务多领域学习的语义分割实验中,研究人员使用了特定的网络架构和多个数据集进行训练,并采用了不同的训练策略。
网络架构与训练细节
- 网络架构 :实验使用的网络架构是对Farabet等人提出的架构的修改版本。前两层卷积层由7×7的滤波器组、ReLU单元、2×2最大池化和批量归一化单元组成。最后一层卷积层后接ReLU单元、批量归一化单元和30%丢弃率的Dropout。全连接层后接ReLU单元,最后一层是数据集级别的Softmax单元。
- 训练过程 :将RGB图像转换为YUV空间,训练输入示例由从图像中裁剪的46×46的补丁、图像所属的数据集以及补丁中心像素的标签组成。使用大小为128的小批量随机梯度下降更新参数,并在验证集上进行早停以防止过拟合。仅使用了补丁的水平翻转作为数据增强策略。
数据集详情
- KITTI数据集 :由七个研究小组部分标注,共736张标注图像,几乎没有重复图像。将其分为训练集、验证集和测试集,平均每个视频帧采样约390,000个补丁,最终得到约2.8亿个适合训练深度学习架构的补丁。不同小组提供的标签存在不一致性,例如对树木、草地等的标注
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



