基于泊松分布的自组织神经网络用于模式发现
1. 引言
模式发现是数据挖掘过程中的一项基础操作,旨在从数据中找出有用的模式,包括检测未知的聚类或关联规则。其目标不仅是识别模式,更要揭示数据中隐藏的内在模式。这些发现的模式基于相似性度量或概率密度模型对数据项进行自然分组,在多个领域有重要应用。例如,在生物信息学中,基因序列和质谱数据的模式发现有助于更好地理解肿瘤发生的途径。
基于无监督学习范式的自组织神经网络(SONNs)在模式发现方面展现出独特优势。
2. SONN原理与应用概述
SONN是一类无需预定义目标输出就能揭示数据中重要模式的网络。在适应输入数据的统计规律时,网络会优化自身参数或进行自组织。这类网络主要有两种基本学习规则:Hebbian学习和竞争学习。
- Hebbian学习 :基于神经元之间突触连接的修改。基于Hebbian学习的SONN可能会使多个输出神经元同时激活。
- 竞争学习 :网络的输出神经元相互竞争,每次只有一个输出神经元被激活。这种特性使竞争学习非常适合识别数据中隐藏的统计显著模式。基于竞争学习的SONN例子包括Kohonen自组织特征映射(SOM)和自适应共振理论(ART)模型。
其中,SOM是文献中研究最广泛的自组织网络之一,用于多个领域的模式发现。在生物医学领域,Golub等人成功应用SOM根据基因表达模式区分白血病的类型和亚型;Lagerholm等人使用SOM对心电图(ECG)搏动进行聚类,误分类率很低。
不过,大多数这些应用都基于数据服从高斯分布
超级会员免费看
订阅专栏 解锁全文
1115

被折叠的 条评论
为什么被折叠?



