独立成分分析与非线性主成分分析详解
1. 独立成分分析(ICA)概述
在数据分析领域,已经提出了许多不同的指标。有些指标是基于正态密度与基于埃尔米特多项式的正交级数密度估计之间的距离,但对高阶矩的依赖往往会突出尾部的非正态性,并且可能对异常值过于敏感;另一些指标则用于表达数据的某些几何特征。
独立成分分析(ICA)从一个类似于特定模型的模型开始,但它施加了一个标准,以确保因子的类似物是相互独立的。正式地,一般的 ICA 模型表示为:
[XXX_i = T(SSS_i, \varepsilon\varepsilon\varepsilon_i) \text{ ,其中 } i = 1, \cdots, n]
在这个模型中,(XXX_i) 是观测值,(SSS_i) 是原始源信号,(\varepsilon\varepsilon\varepsilon_i) 是噪声项,(T) 是系统算子。其核心思想是,一个具有 (K) 个独立成分的信号 (SSS) 被生成,但当通过数据收集过程 (T) 观测为 (XXX) 时,(XXX) 的维度 (\dim(XXX) = p) 。也就是说,(T) 将 (SSS) 的所有成分混合在一起。
有时,上述模型也被称为盲源分离系统模型,因为对于信号的成分如何组合形成 (XXX) 几乎没有或根本没有信息。例如,没有成对的训练集 ((sss_i, xxx_i)) 来帮助识别 (T) 。分析师的任务是利用混合成分的 (n) 次测量来揭示原始信号 (SSS) 或识别系统算子 (T) ,可能两者都要识别。
这个模型可以类比为一个会议场景,假设有 (K) 个人同时说话,他们的声音被 (p) 个麦克风拾取。假设每个人的声音都是独立的,那么麦克风
超级会员免费看
订阅专栏 解锁全文
46万+

被折叠的 条评论
为什么被折叠?



