“过拟合”是把噪声的信息也学习进来了,导致泛化能力差,在新样本上表现差;
“共线性”是自变量相关性太强,导致参数估计不可信,如果完全共线性则导致回归系数估计时系数矩阵的不可逆,使用迭代求解时不收敛,无法计算系数。
例如线性回归时系数求解使用最小二乘法,系数估计beta=(XX’)^(-1) XY,如果两个变量相关,则XX’不可逆
对于决策树算法,共线性与否其实没关系,极端例子,两个变量完全一样时,用哪个变量拆分其实都可以,结果都一样。
根本原因是决策树是启发式算法,而不是严格意义的统计模型