dropout为什么可以防止过拟合呢?
1. 个人理解:dropout后这个model 的function set变小,model表现能力下降
2. 相当于ensemble,因为drop out有一定的随机性,最后train出来的model相当于很多个model的“合体”,有效降低了variance,防止overfitting
3. drop out相当于去掉了一部分特征,这样就不会出现“有2只眼睛的才是猫”这种overfitting的情况,因为drop out自后可以训练出即使只有一只眼睛也能判断是猫的model
dropout自后test的时候需要和train的时候保持一致,