盲源分离:从混合信号中解锁纯净信息
在现实世界中,混合信号无处不在,人类感知到的信息往往受到干扰和降级。比如在声音环境中,我们被各种声音和噪音包围,房间混响进一步干扰,使得语音和音频信号的效果和聆听条件变差;在计算机视觉里,观察到的图像常因噪声模糊、光照影响或反射与其他图像混合,导致目标物体难以检测和识别;医学成像数据,如脑磁图(MEG)和功能磁共振成像(fMRI),也存在外部电磁场干扰,掩盖了大脑活动的有用信息。因此,如何将混合信号分离成各个独立的源信号,成为了一个极具挑战性的问题,吸引了众多研究者投身其中。
1. 源分离概述
盲源分离(BSS)旨在从一组混合信号中分离出源信号,而对源信号或混合过程的信息了解甚少或几乎没有。这是一个跨学科的科学领域,信号处理和机器学习是应对其各种挑战的两大专业领域。在实际应用中,混合系统或传感器网络一般有三种类型:多通道源分离、单声道源分离和解卷积分离。
1.1 多通道源分离
多通道源分离是一个经典的源分离问题,以鸡尾酒会问题为例,在鸡尾酒会上,多个人同时说话,听众试图跟上其中一个讨论。假设有三个说话者{st1, st2, st3}同时说话,附近安装了三个麦克风{xt1, xt2, xt3}来采集语音信号。由于每个麦克风的位置、角度和通道特性不同,采集到的信号会有所混合,形成一个线性混合系统:
xt1 = a11st1 + a12st2 + a13st3,
xt2 = a21st1 + a22st2 + a23st3,
xt3 = a31st1 + a32st2 + a33st3.
这个 3×3
超级会员免费看
订阅专栏 解锁全文
2780

被折叠的 条评论
为什么被折叠?



