1:初始化很重要
2:mini batch size处理,深度模型加成,可以训练过拟合数据,如果这样结果都不满意,可直接换个模型试试了。
3:合适的loss function很重要,交叉熵,准确率走起
4:多方使用relu,batchnorm,dropout,adam,Learning Rate动态设置,初始设置要合理
5:图像预处理中选择 mean/std/ zero-center/max就足够了
6:多尺度的模型可以运用不同的stride进行特征选择
7:模型不确定就选3x3,filter数量2^n,珍惜底层图像特征,不要用过于复杂的模型训练底层