1.为什么是ML策略
对深度神经网络模型的优化可以从很多方面进行,例如:
-
Collect more data
-
Collect more diverse training set
-
Train algorithm longer with gradient descent
-
Try Adam instead of gradient descent
-
Try bigger network
-
Try smaller network
-
Try dropout
-
Add L2 regularization
-
Network architecture: Activation functions, #hidden units…
可选择的方法很多,也很复杂、繁琐。盲目选择、尝试不仅耗费时间而且可能收效甚微。因此,使用快速、有效的策略来优化机器学习模型是非常必要的。
2.正交化
通过每次只调试一个参数,保持其它参数不变,使模型某一性能改变是一种最常用的调参策略,也就是正交化方法。
对应到机器学习监督式学习模型中,可以大致分成四个独立的“功能”,每个“功能”对应一些可调节的唯一的旋钮。四个“功能”如下:
-
Fit training set well on cost function
-
Fit dev set well on cost function
-
Fit test set well on cost function
-
Performs well in real world
其中,第一条优化训练集可以通过使用更复杂的网络、Adam等优化算法来实现;第二条优化验证集可以通过正则化,采用更多训练样本来实现;第三条优化测试集可以通过使用更多的验证集样本来实现;第四条提升实际应用模型可以通过更换验证集,使用新的cost function来实现。概括来说,每一种“功能”对应不同的调节方法。而这些调节方法(旋钮)只会对应一个“功能”,是正交的。
顺便提一下,early stopping在模型功能调试中并不推荐使用。因为early stopping在提升验证集性能的同时降低了训练集的性能。也就是说early stopping同时影响两个“功能”,不具有独立性、正交性。
3.单一数字评估指标
构建、优化机器学习模型时,单值评价指标非常必要。有了量化的单值评价指标后,就能根据这一指标比较不同超参数对应的模型的优劣。
查准率Precision:如果你的分类器(猫)认为该图片是猫,有一定的概率是正确的,这个概率就是查准率。<