模式识别特征选择:时间关联数据的挑战与机遇
1. 神经网络基础概念
人工神经网络(ANNs)被认为能处理大量数据且不会过度消耗资源。这里简要回顾多层感知器(MLP)和深度信念网络(DBNs)。
MLP 是一种基本的 ANN 结构,可以有多个层。其配置基于将一层的输出连接到下一层的输入,并在中间使用非线性可微激活函数。MLP ANNs 使用强化学习的几种反向传播方法进行训练,它是一种监督学习算法,通过训练数据集学习函数 (f(\cdot): R^m \to R^o),其中 (m) 是输入维度,(o) 是输出维度。对于一组特征 (X = {x_1, x_2, \ldots, x_m}) 和目标 (y),它可以学习用于分类或回归的非线性函数。
以单隐藏层 MLP 为例,特征在左侧表示,隐藏层(中间层)通过加权线性求和 (w_1x_1 + w_2x_2 + \cdots + w_mx_m) 变换左侧层的值,然后使用非线性激活函数 (g(\cdot): R \to R)(如双曲函数)。输出层接收最后一个隐藏层的值并将其转换为输出值。为了使用 MLP 对分类任务进行建模,ANN 为每个类设置一个输出神经元,成功分类会使相应神经元类的激活水平更高。
深度学习是一种相对较新的技术,尤其是深度信念网络(DBNs)。DBN 的深度学习过程包括两个步骤:逐层特征抽象和重建权重微调。在第一步中,DBN 使用受限玻尔兹曼机(RBM)计算权重的重建。在第二步中,DBN 执行反向传播以实现第一步中获得的所需权重。
在 RBM 中,有“能量”的概念,它是可见层和隐藏层的联合配置,定义为:
[E(v, h, \theta) = - \sum_{i,j} W_{ij
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



