39、GA 优化 HMM 用于自动语音识别及多口音语音统一系统

奶茶鉴定专家212

于 2025-07-20 09:25:54 发布

阅读量54

点赞数

CC 4.0 BY-SA版权

分类专栏：模式识别前沿：MCPR 2012会议精华文章标签： GA优化 HMM 自动语音识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/gpt4scribbler/article/details/149542089

模式识别前沿：MCPR 2012会议精华专栏收录该内容

39 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

GA 优化 HMM 用于自动语音识别及多口音语音统一系统

1 GA 优化 HMM 用于自动语音识别

1.1 GA 方法流程

在该自动语音识别优化方案中，采用了两种遗传算法（GA）方法来优化隐马尔可夫模型（HMM）的转移概率和结构。

方法二：轮盘赌选择

首先是方法二，对归一化初始种群进行轮盘赌选择。选择双亲对后，进行交叉和变异操作以产生后代。
- 交叉操作 ：采用单点交叉，交叉点随机选择，可设置在染色体的 207 个二进制位中的任意位置。
- 变异操作 ：交叉后进行变异，即随机改变一个二进制位。若后代不满足任何限制条件，则再次进行变异以产生有效的后代。
- 解码与归一化 ：最后，将后代解码为原始整数值，再除以 1000000000 得到表现型。将这些值归一化，形成与相关音素对应的有效转移概率（即有效转移矩阵）。

在这种方法中，每次测试一个后代，以衡量训练语音数据上的单词识别准确率的提高情况。若有提高，则测试下一个后代；否则，再次进行轮盘赌选择。保留能提高 HMM 性能的后代，其单词识别准确率成为该个体的适应度值。测试完所有 44 个后代后，将该种群作为初始种群再次执行 GA（最多执行 5 次）。其收敛图如图 5 所示。

1.2 语音数据与基线识别器

使用 HTK 工具包构建了一个与说话人无关（SI）的基线语音识别器。采用英国英语《华尔街日报》（WSJ）数据库，识别器的训练集包含来自 92 位说话人的 WSJ 数据，用于构建 45 个单音素声学模型。这

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。