- 博客(4)
- 资源 (1)
- 收藏
- 关注

原创 TTS——离线语音合成实现
TTS是Text To Speech的缩写,即“从文本到语音”,是人机对话的一部分,让机器能够说话。本项目是一个基于Python的本地离线语音合成(TTS),要用python3 才可以的。原理十分简单:首先将中文转为拼音,通过将文本与语音对照的方法实现了转换,然后再播放对应文字对应的拼音所对应的音频来播放语音即可。十分简单。使用方法:cmd进入到对应的文件路径...
2020-05-08 00:47:11
7231
3
原创 Windows端python ui 自动化
把你需要点击的ui 用Windows键 + Shift + S组合键并拖动鼠标,选择UI元素的屏幕截图。使用的PyAutoGUI库来定位UI元素,可以用图像识别和UI元素坐标位置(x和y)用于Windows端测试过程中重复点击某一个ui 测试兼容性及内存是否泄漏。修改文件中UI元素命名,运行文件即可。把其保存到和python同一个目录。
2024-01-02 19:27:49
640
原创 polqa语音质量评估方法算法研究
1.客观语音质量评估方法ITU- T提出的P.862 PESQ 和 P.863 POLQA两种客观语音质量评估方法都基于感知模型,原理基本一致,主要差别在于认知模型,在算法细节上有了明显的改进。PESQ和POLQA的原理如图所示。PESQ算法主要工作流程首先是将参考信号和劣化信号做电平调整和滤波,然后通过时间对齐得到延迟信息,并且参考信号和劣化信号经过感知模型的处理得到两者的感知差异,最后计算MOS评分结果 。P.862算法提供的PESQ分值范围是-0.5~4.5,和主观MOS分值还有差距。
2022-03-06 02:55:35
6241
2
python实现TTS离线语音合成
2020-05-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人