一个模型的好坏的评估基准可以从下面几个方面考虑:
1.考虑人类在这个问题上的表现
2.对比竞争算法的表现
3.根据经验猜测

判断是高偏差还是高方差
训练样本数量越多,越难完美地拟合每个样本,因此 J_train 会逐渐增大一点点,但泛化能力也逐渐增强;
高偏差的情况:
模型太简单了,再怎么加数据误差也差不多,假设以人类水平为基准,则J_train和基准之间差距较大,图像一直水平向右延伸,增加样本数量并不会有什么改变。
高方差的情况:
J_train可能会比人类的表现好一些,但 J_cv 仍远大于 J_train。这种情况下可以增加样本数量或许能使模型表现得更好。

本文讨论了评估模型好坏的关键因素,包括与人类在相应问题上的表现对比、竞争算法的比较,以及通过训练样本数量对高偏差和高方差的识别。高偏差模型即使增加数据也无法显著提升,而高方差模型在训练集上表现良好,但在交叉验证中较差,可通过增加样本改善。
1531

被折叠的 条评论
为什么被折叠?



