语音合成论文优选:使用脑电图来进行语音合成speech synthesis using eeg

本文介绍了一种使用脑电图(EEG)进行语音合成的方法,首先记录与语音对应的EEG信号,接着训练EEG与声学特征间的映射模型,最终实现通过EEG信号合成语音的目标。此研究对于帮助失语者恢复‘说话’能力具有重要意义。
部署运行你感兴趣的模型镜像

声明:语音合成论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法。如有转载,请标注来源。

欢迎关注微信公众号:低调奋进

SPEECH SYNTHESIS USING EEG

该文章是德克萨斯大学奥斯汀分校脑机接口实验室2020.05.03发表使用脑电图来进行语音合成的文章,属于前瞻性的研究,具体的文章链接

https://arxiv.org/pdf/2002.12756.pdf

1 研究背景

语音合成把文本转成语音,本文的目的是使用脑电图来进行语音合成。首先是记录语音相对应的脑电图,然后训练脑电图和声学特征之间的映射模型,这样就可以通过脑电图进行语音合成。(多说一句,这种交叉学科的研究太有意义了,最直观的当然是帮助失语的人恢复“说话”,但我的第一想法就是万物交流。可以凭借脑电图这个中间表现形式进行物种之间的交流,这想想都十分有意思,当然这需要交叉学科研究人员加油)

2 系统结构

搞交叉研究领域使用的架构很简单,如图1所示,两层gru模型。其中脑电图的采集装备传感器的位置为图2所示。
 

3 实验结果

本文的实验测试主要客观指标,毕竟不是纯搞语音合成的,可惜没有样音,具体的结果不做介绍。

您可能感兴趣的与本文相关的镜像

HunyuanVideo-Foley

HunyuanVideo-Foley

语音合成

HunyuanVideo-Foley是由腾讯混元2025年8月28日宣布开源端到端视频音效生成模型,用户只需输入视频和文字,就能为视频匹配电影级音效

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我叫永强

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值