TTS实现过程（大白话）

最新推荐文章于 2025-02-24 13:49:36 发布

代码小鬼才

最新推荐文章于 2025-02-24 13:49:36 发布

阅读量1.5k

点赞数 2

分类专栏：随笔文章标签：深度学习机器学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_34171593/article/details/123119808

版权

随笔专栏收录该内容

7 篇文章

订阅专栏

实现TTS先了解数据wav文件

不知道童鞋们知不知道scipy这个函数（看，有童鞋举爪了），这个函数实现了读取wav文件的过程，具体是：scipy.io.wavefile这个函数，这个函数读取wav文件之后表现为数组的形式，这样就明了多了，wav文件通过scipy转码成为了数组的形式，同样数组也可以通过scipy.io.wavefile实现存为wav文件。好了，有了对数据的基础认识，接下来聊聊TTS

TTS实现

目前主流的方法大家应该也都了解过是将文字转化为拼音再转化为id，然后通过训练获得模型。浅了浅了，实际上是，文字先转化为拼音，拼音再转化为音素，音素再对应id，id再进行独热编码获得基础特征，后再通过其他的嵌入手段将独热编码稀疏性的缺点抹除，然后再通过构建的模型进行训练，那你可能会说，指导数据呢？前面不是提到了scipy的wav文件读取为数组的方法嘛，你看这不就出来了，文字-->id-->embeding-->model-->通过读取wav的数组指导训练结果

其实往细了讲在进行训练之前还包括数据对齐和数据预处理以及数据归一化，训练之后还包括滤波和声码器合成等操作，确实是一个较难的项目。

代码小鬼才

博客等级

码龄9年

45
原创

265
点赞

292
收藏

226
粉丝

关注

私信

热门文章

分类专栏

随笔 7篇
工具 1篇
rasa 6篇
API接口调用 1篇

展开全部收起

最新评论

开源 Python 财务软件
代码小鬼才: 功能流程图 1、注册 1.1我是房东 1.1.1点击我是房东，展示列表，列表字段：设备编号、充电桩所属地。该列表支持增删改查，其中删除时，要再询问一遍是否删除防止误操作；房东绑定微信或支付宝。 1.2我是合伙人 1.2.1点击我是合伙人，展示列表，列表字段：设备编号、区域电费标准（元/度）。该列表支持增删改查，其中删除时，要再询问一遍是否删除防止误操作，合伙人绑定微信或支付宝 2、登陆 2.1我是房东 2.1.1点击我是房东，一级列表字段：设备编号、充电桩所属地。点击设备编号，进入下一步，展示历史提交列表，历史提交列表包含字段：提交凭证（电表照片）、标定度数、提交时间、点击查看凭证。新增按钮，需要提交的列表：提交凭证（电表照片）、标定度数、提交按钮。 2.2我是合伙人 2.1.1点击我是合伙人，一级列表字段：设备编号、充电桩所属地。点击设备编号，进入下一步，展示历史审核列表，历史审核列表（审核通过、驳回按钮失效）包含字段：提交凭证（电表照片）、标定度数、审核时间、点击查看凭证。合伙人不能新增，房东新增一条记录后，合伙人这里会新增一条记录，并有一个审核按钮和驳回按钮，点击审核通过、驳回，进入支付页面，支持支付宝、微信支付。整体逻辑，房东登录后，提交一条记录，根据充电桩唯一编号，将该列表发送给合伙人审核，合伙人审核通过后进入支付页面进行支付，支付时自动根据区域电费标准*（最新标定度数-上次标定度数）计算电费，并跳转微信或支付宝支付。合伙人发现提交凭证与标定度数不符时，点击驳回，驳回时需要备注驳回理由，房东收到驳回后重新上传凭证修改标定度数，重新提交，后续合伙人审核，直到审核通过，继续支付
LIDC-IDRI肺结节公开数据集
2301_79933825: 提取码错误呢
YOLO8分类任务-总结
2301_78181968: 请问有没有分类模型的网络结构图啊
rasa 略深层次理解
代码小鬼才: 你想在自定义动作中获取插槽类型吗
rasa 略深层次理解
内卷焦虑人士: 定义插槽的type怎么确定呢？文本的都是rasa.shared.core.slots.TextSlot，有自定义的都是categories？

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。