
语音处理
语音合成TTS,语音处理,语音转换相关内容。
行走的笔记
执行力!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
使用librosa库对音频信号进行采样以及分帧处理
对于时长 T=2s 的音频信号 path.wav,设置采样率为 sr=24000。采样之后,生成音频时间序列 y,其中 len(y) = T * sr = 2 × 24000 = 48000,y.shape = (48000, ),sr=24000。import librosa# 读取音频y, sr = librosa.load(path='path.wav', sr=24000)print(len(y), y.shape, sr)设置:帧移:frame_shift = 0..原创 2020-10-20 16:19:06 · 4767 阅读 · 0 评论 -
基于Tacotron模型的语音合成——代码实践
一、模型下载与安装下载tacotron模型的实现到本地,这里是基于GitHub上一个tacotron模型的实现开展研究的,GitHub网址:https://github.com/keithito/tacotron,由于谷歌没有给出tacotron模型的官方实现,这里给出了tacotron模型的非官方实现;------研究是在linux下开展的,由于源码较多,只展示tacotron模型源码的基本结构如下:安装一些依赖项:① 安装Python 3。# 使用Anaconda安装Python3环境.原创 2020-10-14 12:52:56 · 3222 阅读 · 11 评论 -
语音基础知识,语音特征之【声谱图,log梅尔谱,MFCC,deltas】
语音基础知识:https://www.cnblogs.com/liaohuiqiang/p/9916352.html语音特征提取:https://www.cnblogs.com/liaohuiqiang/p/10159429.html语音特征参数MFCC提取过程:https://my.oschina.net/jamesju/blog/193343https://blog.youkuaiyun.com/zkl99999/article/details/80723755...转载 2020-06-28 13:45:07 · 2316 阅读 · 0 评论 -
语音识别软件包、代码示例、数据集汇集
目录语音识别工具语音识别示例代码kaldi/语音识别ASR/声纹识别SRE/资源汇总参考链接 https://zhuanlan.zhihu.com/p/103034947语音识别工具(1)librosa:python,视频与音乐分析链接:https://github.com/librosa/librosa(2)ASRT_SpeechRecognition:python,基于深度学习的...转载 2020-05-19 18:05:08 · 385 阅读 · 0 评论