基于尖峰神经网络的极端学习层助力语音数字识别
1. 引言
语音识别在教育、医疗、安全和通信等众多领域有着广泛的应用。然而,当前语音识别系统面临的一个主要障碍是难以处理信号中的噪声,而人类大脑几乎不受噪声影响。因此,探索新的策略来解决这一问题显得尤为重要,特别是那些受听觉系统和人类大脑功能启发的策略。
深度学习神经网络(DNNs)在大多数语音相关任务中表现出色,能够直接从原始语音样本中学习特征。但DNNs也存在计算需求高和能耗大等缺点,这促使科学界不断寻找替代方案。
近年来,尖峰神经网络(SNNs)受到了越来越多的关注。SNNs是一种特殊的人工神经网络,旨在模拟生物神经元的功能。它具有事件驱动和并行实现的特点,能够提高效率。SNNs通过脉冲来模拟生物神经元的动作电位进行神经元之间的通信,这些电位可以用二进制代码高效建模,便于在数字设备中实现。此外,SNNs还能模拟生物神经元的膜内电位,具有类似的时间动态,适合处理语音等时间信号。
极端学习机(ELM)是一种由Huang等人提出的学习技术,可用于快速高效地训练单隐藏层神经网络。其基本思想是随机分配输入层和隐藏层之间的连接权重,然后使用闭式解析公式计算隐藏层和输出层之间的连接权重。与其他神经网络训练方法相比,ELM具有训练速度快、易于实现等优点,并且在包括语音识别在内的各种分类任务中表现良好。
在这项工作中,我们提出了一种新的监督神经网络——数字极端学习尖峰神经网络(DELSNN),并在语音数字识别任务上进行了测试。DELSNN受到了Unnikrishnan和Hopfield经典工作的启发,但我们增加了一个极端学习层。Unnikrishnan提出了一种使用语音频谱特征的二进制时间编码来识别孤立数字
超级会员免费看
订阅专栏 解锁全文
1546

被折叠的 条评论
为什么被折叠?



