语音识别中的混合遗传 - 神经前端扩展与高效维特比算法
在语音识别领域,为了提高识别的准确性和鲁棒性,研究人员不断探索新的方法和技术。本文将介绍两种重要的技术:混合遗传 - 神经前端扩展和基于词汇树模型的高效维特比算法。
混合遗传 - 神经前端扩展
- 进化过程
- 进化过程始于创建一组权重因子 $g_i$($i = 1, …, N$),这些权重因子代表个体。个体在一个应用遗传算子的池中经过多代进化。
- 根据个体的性能选择部分个体进行繁殖,个体的评估通过目标函数进行。当获得最适合的个体(最佳权重集)时,将其用于测试阶段以投影噪声数据。
- 经过基因修改的 MFCC 及其一阶和二阶导数最终用作识别过程的增强特征。
- 初始化、终止和解决方案表示
- 为了描述种群中的每个个体,需要一种解决方案表示。对于本应用,用于函数优化的个体的有用表示涉及来自浮点数字母表的基因或变量,其值在变量的上下限 $(a_i, b_i)$ 内。
- 池的初始化理想情况下基于零知识假设,即从一组完全随机的权重值开始,这些值在上下边界内遵循均匀分布。
- 当达到一定的最大代数时,进化过程终止,这个代数对应于目标函数的收敛。
- 选择函数
- 一种常见的选择方法是根据个体的目标函数值为每个个体 $j$ 分配选择概率 $P_j$。
超级会员免费看
订阅专栏 解锁全文
187

被折叠的 条评论
为什么被折叠?



