
【语音处理】
文章平均质量分 87
包括语音识别和语音信号处理
Yang SiCheng
这个作者很懒,什么都没留下…
展开
-
【20220121】Voice conversion
Speech Representation Disentanglement with Adversarial Mutual Information Learning for One-shot Voice Conversion 中间结果原创 2022-08-09 10:46:55 · 2232 阅读 · 1 评论 -
【语音信号处理】3语音信号可视化——prosody
在之前的工作上增加了韵律的相关特征提取,之前可见:【语音信号处理】1语音信号可视化——时域、频域、语谱图、MFCC详细思路与计算、差分安装一下这个库:还有其他的一些,反正缺啥安啥:2. 最终结果...原创 2022-06-12 14:03:38 · 1560 阅读 · 1 评论 -
【语音信号处理】2语音信号实践——LSTM(hidden、output)、Attention、语音可视化
语音关于class torch.utils.data.Dataset官方文档,原创 2021-04-16 23:18:01 · 1722 阅读 · 3 评论 -
【语音信号处理】1语音信号可视化——时域、频域、语谱图、MFCC详细思路与计算、差分
@TOC1. 数据获取数据集来自:中国科学院自动化所的CASIA汉语情感语料库——共包括四个专业最佳人,六种情绪生气(怒),高兴(高兴) ),害怕(fear),悲伤(sad),其他(surprise)和中性(neutral),共9600句不同最佳。其中300句是相同文本的,也就是说对相同的文本赋以不同的情感来阅读,这些语料可以利用对比分析不同的情感状态下的声学和韵律表现;另外100句是不同文本的,这些文本从字面意思就可以修剪其情感归属,以便录音人更准确地表现出情感,但完整的CASIA数据集是收费的,原创 2021-04-14 15:11:06 · 15685 阅读 · 5 评论 -
【语音识别】获得MOOC视频的文本(字幕)
这里写自定义目录标题首先从以下地址下载获得视频:http://mooc1vod.stu.126.net/nos/mp4/2016/11/24/1005374032_1241ef3e8a474c9898e1e62f0268ca6c_hd.mp4?ak=7909bff134372bffca53cdc2c17adc27a4c38c6336120510aea1ae1790819de8c3092915cb74e414787263398b5d5a484f5c959cdb6ce7e3c6a3acf758b3c64d30原创 2021-01-26 22:24:01 · 1595 阅读 · 0 评论