大家好,我是Mac Jiang。今天和大家分享Coursera-Stanford University-Machine Learning-Week8:Dimensionality Reduction-Quiz:Principal Component Analysis的课后习题解答。提醒:每个同学课后习题的题目参数和选项都是不同的,在参考时请看清题目,避免错误!
1.第一题
(1)题意:有个2D数据集,其可视化图如图所示。下面有四个选项的图形,哪几张图可能是PCA算法得到的向量图?
(2)分析:因为PCA得到的直线要使各样本在此直线上的投影最小,随意直线必定斜率为1左右。当然,如果用向量表示直线的方向,则有向x正方向,x反方向两种选择,故1,2都是正确的。
(3)答案:1,2
2.第二题
(1)题意:下列哪个方法是选择PCA下降后维度k的好方法?
1.选取k为最接近0.99*m的整数
2.选择能使保留99%差异性的最大k
3.选择能保留99%差异性的最小k
4.利用肘部法
(2)分析:1.错误,要是样本数m远远大于初始维度n,那么k就很大,反而是增加维度了
2.错误,选择的是满足99%差异性的最小k,因为降低后的维度当然是越小越好。维度越小,数据量越小,所需要的存