- SVD,Singular Value Decomposition奇异值分解
提取信息方法
可看成是从噪声中抽取信息 - 信息检索:
隐性语义检索LSI,Latent Semantic Indexing
隐形语义分析LSA,Latent Semantic Analysis
- 推荐系统
利用SVD从数据中构建一个主题空间
再利用其空间下构建相似度
(高维->低维,低维空间中计算相似度,提升RS效率)
矩阵分解
数据矩阵分解为多个独立的部分
易于处理的形式
两个或多个矩阵的乘积 - SVD是矩阵分解的一种类型
U, Σ \Sigma Σ,V
Σ \Sigma Σ只有对角元素,从大到小排列,称为奇异值
奇异值与特征值(PCA 数据中重要特征)是有关系的。就是矩阵 ( D a t a ∗ D a t a T ) (Data* Data^T) (Data∗DataT)特征值的平方根
在某个奇异值的数目(r 个=>奇异值的平方和累加到总值的90%以上)之后,其他的奇异值都置为0(近似于0)。
意味着数据集中仅有 r 个重要特征,而其余特征则都是噪声或冗余特征 - 优点:简化数据,去除噪声
- 缺点:转换难以理解
svd简化
最新推荐文章于 2024-08-19 09:39:06 发布