
Data cleaning
文章平均质量分 91
Joy CR
欢迎关注我的公众号: 小秋的博客
https://blog.youkuaiyun.com/xiaoqiu_cr
https://github.com/crr121
https://segmentfault.com/u/chenrong_flying
联系邮箱:rongchen633@gmail.com
展开
-
PCA主成分分析进行数据降维
1、PCA的原理PCA:principal component analysis 主成分分析,PCA通过更换数据的坐标系来达到降维的目的。第一个坐标轴是原始数据的方差最大的方向,第二个坐标轴是与第一个坐标轴正交并且方差次大的方向2、PCA的优缺点优点:降低数据的复杂性,识别最重要的多个特征缺点:不一定需要,且有可能损失重要信息3、PCA伪代码'''去除平均值原创 2018-02-06 16:19:05 · 1273 阅读 · 0 评论 -
将SVD应用于推荐系统
1、什么是SVDsingular value decomposition 奇异值分解,通过SVD实现从噪声数据中抽取相关特征2、SVD的应用2.1信息检索隐形语义索引LSI:latent semantic indexing隐形语义分析LSA:latent semantic analysis再LSA中,一个矩阵是由文档和词语构成,我们利用SVD对矩阵进行分解,就会得到多个奇异原创 2018-02-07 16:39:15 · 476 阅读 · 0 评论