UFLDL上的ICA为什么一定要做PCA whiten

最新推荐文章于 2024-07-11 09:39:50 发布

原创最新推荐文章于 2024-07-11 09:39:50 发布 · 4.3k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#deep-learning #ICA #PCA白化

深度学习专栏收录该内容

8 篇文章

订阅专栏

本文探讨了无监督学习中PCA与ICA两种降维技术的应用，并解释了为何在进行ICA之前需要先对数据进行PCA白化的原理。通过对比PCA与ICA的损失函数，揭示了它们在提取数据特征方面的不同作用。

　　Andrew Ng先生的UFLDL教程真可谓deep learning入门的首选课程。在两年前我看教程里讲ICA部分的（链接）时候，里面提到使用教程所述的ICA模型时，输入数据必须经过PCA白化操作，页面上有个TODO问为什么要这样做。以当年的我对机器学习的理解并不能解答这个问题，就只是按照教程上讲的写完了代码，后来就一直没有看过了。
　　今天在与人讨论无监督学习的几种损失函数的时候，提到了PCA的损失函数：

max ∥ W x ∥ 2 s . t . W W T = I,

$\max \|Wx\|_2 \quad s.t. WW^T=I,$
优化这个方差，就可以得到最大化方差的解。其中，

W $W$ 是个扁矩阵，以起到降维的作用。我们都知道，这个优化式可以通过svd求解：

W=USV $W = USV$ ，取

U $U$ 的前几列，即可得到降维用的旋转矩阵，而最后几个奇异值，对应

U $U$ 的最后几列，一般都会是接近0的数，是要丢掉的。
　　这时，我突然想起来，为什么ICA的损失函数会使用min函数：

min ∥ W x ∥ 1 s . t . W W T = I .

$\min \|Wx\|_1 \quad s.t. WW^T=I.$
　　要知道

ℓ1 $\ell 1$ 范数和

ℓ2 $\ell 2$ 范数的差别确实有，但并不是那么明显，如果使用min函数的话，岂不是找到了没有数据的那些子空间去了？
　　于是我就去翻了下教程，原来这里需要先对

x $x$ 做PCA白化，先取到

x $x$ 的方差较大的几维子空间，再在这上面做最小化操作，如果把这里的

ℓ1 $\ell 1$ 范数换为

ℓ2 $\ell 2$ 范数，得到的实际上就是

U 的中间几列。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。