音转|Eressive Voice Conversion: A Joint Framework for Speaker Identity and Emotional Style TransferZon

落雪snowflake

于 2023-08-07 23:19:03 发布

阅读量178

点赞数

CC 4.0 BY-SA版权

分类专栏：语音转换---深度学习智能语音技术学习文章标签：语音识别人工智能

原文链接：https://arxiv.org/abs/2107.03748

语音转换---深度学习智能语音技术学习专栏收录该内容

8 篇文章 ¥89.90 ¥99.00

订阅专栏

超级会员免费看

本文提出了一种无需并行数据的表达性语音转换框架，利用StarGAN进行说话者身份和情感风格的联合转换。通过对深度情绪风格特征的学习，实现了在保留语言信息的同时转换说话者身份和情绪风格。实验结果显示，该框架在多对多转换中表现出色，有效传递了情感风格和说话人身份。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

音色转换粗翻|||Expressive Voice Conversion: A Joint Framework for Speaker Identity and Emotional Style Transfer

表达性语音转换：一个针对说话者身份和情感风格转换的联合框架

Zongyang Du, Berrak Sisman, Kun Zhou, Haizhou Li

Traditional voice conversion(VC) has been focused on speaker identity conversion for speech wit

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。