数据量大的时候先对数据进行训练集、验证集和测试集的划分,数据量小的时候先划分训练和验证集合(测试可以在最后的时候对各种验证效果好的模型进行最终测试),这样数据集扩增的时候就只在训练集进行,以免数据信息训练和测试融合.
网络:未训练的/预训练的;
预处理:数据扩增augmentation(eg: 随机水平翻转,旋转,crop);基于均值和标准差的图像正则化(训练集单独归一化,一般用均值方差归一化,保留后用于验证和测试集合);
模型:效果最佳的模型相互整合/融合;
过拟合时:增大正则项权重,增加数据集(细胞核的核心位置做微小的移动),增大细胞补丁的size。


持续更新
本文探讨了在不同数据量下如何合理地划分数据集,并介绍了数据扩增、图像正则化等预处理方法,以及如何整合效果最佳的模型来避免过拟合等问题。
1079

被折叠的 条评论
为什么被折叠?



