对于本章的课程,感觉一张表就可以概括清楚,不过其内在分析却着实需要花上一番功夫才能完全弄明白。废话不多说,做这一章的题这一张表基本上就够了。


分析:从learning curve可以看出,随着Training set Size的增加,Jtest明显下降,证明算法存在的问题是high variance。
答案:2
分析:由提干可知,上述算法主要的问题是high variance,所以对照着上面表格来选择就ok了。
答案:1,2
分析:似乎与上一题类似,分析提干可知算法存在的问题是high bias。
答案:3,4
分析:选项1,3可以对照着概括的表格进行判断,都是正确的;选项2也是很常识性的;选项4明细就是因果跌倒,增加训练集可以解决high variance的问题,但是导致high variance的原因还有其他的,比如特征数量太多,所以这是错的。
答案:1,2,3