
特征工程
TangowL
这个作者很懒,什么都没留下…
展开
-
数据预处理之特征标准化
数据预处理之标准化原创 2015-12-11 15:01:55 · 9805 阅读 · 4 评论 -
数据预处理之数据降维 PCA法
数据降维之PCA与SVD法原创 2016-03-03 20:09:32 · 6927 阅读 · 1 评论 -
机器学习中的非均衡分类问题
非均衡分类问题是指在分类器训练时,正例数目和反例数目不相等(相差很大),或者错分正反例导致的代价不同(可从代价矩阵观测)时存在的问题。原创 2015-11-18 09:32:27 · 2054 阅读 · 2 评论 -
S折交叉验证 in Python
在样本数据不充足情况下,可以选择S折交叉验证方法。另外推荐系统中离线实验对于评测指标的获取也是采用的S折交叉验证方法。原创 2015-11-22 15:28:44 · 3065 阅读 · 0 评论 -
逻辑斯蒂回归中特征共线性或强相关的影响
理论解释共线性,指多元回归模型中,各自变量之中至少有两个完全或高度相关。一方面,自变量之间的强相关,虽不会影响对应回归系数的大小,但会扩大其回归系数的方差。由于回归系数比上标准差,即检验该回归系数是否显著的 t 值。由于 t 值的降低,导致回归系数不显著,将无法拒绝一个错误的零假设。另一方面,自变量之间的强相关,可能导致回归系数的正负方向与真实的相反,影响特征的可解释性。可以认为 ...原创 2018-09-06 21:05:24 · 8892 阅读 · 1 评论