关于独立主成分分析（ICA）的学习

最新推荐文章于 2024-10-18 12:27:51 发布

kiyoxi

最新推荐文章于 2024-10-18 12:27:51 发布

阅读量1.8k

点赞数 2

分类专栏：数学基础

本文链接：https://blog.youkuaiyun.com/heiha1232/article/details/105037791

版权

本文深入探讨信息论的基础概念，包括熵、KL散度和互信息，并详细介绍了独立主成分分析（ICA）的基本原理，如最大似然估计、FastICA算法，以及非高斯性的最大化方法。通过实例和相关度量，揭示了ICA在信号分离中的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

关于信息论的概念和独立主成分分析（ICA）的学习

一、关于信息论
二、关于独立主成分分析ICA（Independent Component Analysis）

一直搞不清ICA里面的独立性和信息论里面两个分布相关性之间的关系，在这里重新学习一下
参考：《Machine Learning：A Probabilistic Perspective》 by Kevin P. Murphy

一、关于信息论

“Information theory is concerned with representing data in a compact fashion (a task known as data compression or source coding), as well as with transmitting and sorting it in a way that is robust to errors (a task known as error correction or channel coding). ”

1、熵(Entropy)

随机变量 $X$ 具有分布 $p$ ，则它的熵写作： $\mathbb H(X)$ ，或者， $\mathbb H(p)$ ，用于衡量不确定性。

更具体地，对于离散变量 $X$ ，其有 $K$ 个可能的状态，则它的熵定义为：

$\mathbb H(X) \overset{\underset{\mathrm{\triangle}}{}}{=}-\sum_{k=1}^K p(X=k)\log_2p(X=k)$

其中， $log_2$ 可以认为是二进制编码，上式求和过程可认为是求取平均二进制编码位数

例： $X=\{1,\dots,5\}$ ，其对应的分布为 $p = [0.25, 0.25, 0.2, 0.15, 0.15]$ ，则可求得 $H = 2.2855$ 。
可证明当 $X$ 满足均匀分布时，熵得到最大化，即 $p (x = k) = 1 / K$ ，此时熵值为 $\mathbb H(X)=\log_2K$ 。反之，若 $X$ 的分布为delta-function，此时熵最小，熵值为0。

对于二元随机变量，即 $X\in\{0,1\}$ ，其概率分布可写作 $p(X=1)=\theta$ 、 $p(X=0)=1-\theta$ ，则熵写作：
$\mathbb H(X)$
$p(X=1)\log_2p(X=1)+p(X=0)\log_2p(X=0)]$
$=-[\theta\log_2\theta+(1-\theta)\log_2(1-\theta)]$