6、奇异值分解中的截断、对齐与随机化方法

最新推荐文章于 2025-10-15 13:08:40 发布

电竞养老选手

最新推荐文章于 2025-10-15 13:08:40 发布

阅读量15

点赞数

CC 4.0 BY-SA版权

分类专栏：数据驱动的科学革命文章标签：奇异值分解截断 SVD

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/tensor9flow/article/details/152346797

数据驱动的科学革命专栏收录该内容

50 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

奇异值分解中的截断、对齐与随机化方法

在数据处理和分析中，奇异值分解（SVD）是一种强大的工具，但在实际应用中，我们需要面对诸如截断和数据对齐等问题，同时随机化SVD算法也为处理大规模数据提供了新的思路。

1. 截断与对齐

在使用SVD时，决定保留多少个奇异值（即截断位置）是一个非常重要且具有争议性的决策。这受到多种因素的影响，包括系统期望的秩、噪声大小以及奇异值的分布。

1.1 截断方法

按方差或能量截断 ：通常在某个秩 $r$ 处截断SVD，以捕获原始数据中预定比例（如90%或99%）的方差或能量。尽管这种方法比较粗略，但应用广泛。
识别“肘部”或“膝部” ：在奇异值分布中识别“肘部”或“膝部”，这些位置可能表示从代表重要模式的奇异值到代表噪声的奇异值的过渡。
硬阈值截断 ：将截断视为对奇异值的硬阈值处理，大于阈值 $\tau$ 的奇异值被保留，其余的则被截断。Gavish和Donoho的研究提供了在特定条件下的最优截断值（硬阈值），为使用SVD获得低秩矩阵近似提供了一种原则性方法。

1.2 最优硬阈值

假设数据矩阵 $X$ 是一个低秩或近似低秩矩阵 $X_{true}$ 与噪声矩阵 $X_{noise}$ 的和：
$X = X_{true} + \gamma X_{noise}$
其中，$X_{noise}$ 的元素是独立同分布（i.i.d.）的高斯随机变量，均值为零，方差为1，$\gamma$ 表示

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。