重磅!一行代码轻松搞定中英文语音识别与语音合成|代码开源!

介绍了一个强大的开源项目,能够实现中英文语音识别、翻译及合成等功能。项目不仅效果出众,且易于集成,支持自定义训练,提供了丰富的预训练模型。

导读

要说生活里最常见的AI应用场景,语音合成与识别当属大家最为耳熟能详的场景之一了。

寻常到平时地图导航的播报、微信语音转文字、手机语音输入,以及小度智能音箱,都离不开语音技术的加持。

语音技术到底是怎么实现的?有哪些现成可用的开源代码可以快速集成到项目里?可以说是每一名开发者非常关心的问题。

那么,福利时间到了,今天这个集成了中英文语音识别、语音翻译、语音合成、声音分类能力,而且一行代码轻松试验效果的开源项目,你一定不能错过!

项目介绍

话不多说,先来看项目中给出的效果展示。

语音识别

输入音频 1

识别结果 1

I knocked at the door on the ancient side of the building.


输入音频 2

识别结果 2

我认为跑步最重要的就是给我带来了身体健康。

语音翻译(英译中)

输入音频3

识别结果

我 在 这栋 建筑 的 古老 门上 敲门。

语音合成

输入文本 1

Life was like a box of chocolates, you never know what you're gonna get.

合成音频 1


输入文本 2

早上好,今天是2020/10/29,最低温度是-3°C。

合成音频 2

可以看到,无论是中英文的识别,还是中英文的合成,这个开源项目都有不错的效果,特别的,项目中还包含了语音翻译能力,可以实现英文语音同传翻译为中文字幕,这个确实太强大了。

传送门:

GitHub 地址:

https://github.com/PaddlePaddle/PaddleSpeech

有读者肯定想问,这么强大的语音能力,是不是想要用起来比较麻烦?

不得不说,这个项目在易用性上真的也是考虑得非常周到。

安装测试效果

我们按照首页的引导:

一行命令安装:

66b95205f72eff94900691c78653d34c.png

一行命令快速开始使用: 

e1fce6c926147744a670133d741a7908.png

这里,小编抱着试一试的态度,在本机上安装了这个项目,安装完成之后,先使用语音合成试一下。

31a09ae422bed1144ffbb65ae9617ff8.png

生成的效果大家可以听一下~

然后,带着好奇心,我们再把合成的结果送到语音识别试一下,看看效果:

ce991e0af97ed4e1018a0b243c104e7d.png

最终输出结果:

6a8b79cacef03b73d120217de98e1e10.png

可以看到,这一套循环下来,效果非常不错!

除了出色的效果,易用的体验,我们再看看这个项目中还有什么宝藏可以挖掘,果然我们发现项目中还包含丰富的预训练模型,并且语音识别和语音合成均支持自定义训练。

丰富的预训练模型

语音识别包含声学模型和语言模型, 详情如下:

debbb843cf46904005787ede4f367ef7.png

语音合成主要包含三个模块:文本前端、声学模型和声码器。声学模型和声码器模型如下:

35e2d1e276bbb6f94492aff9422fbe7f.png

完善的文档教程

90c0863a142ab8d07900aedce15ada2b.png

并且开源以来,收到开发者的广泛关注,已经有大量开发者投入到项目的建设中并且贡献内容。

1d12d7928a49d8f7e49824c05fbdff5a.png

真·干货满满!

16b398cdd5d8505963dcbd92e263bb78.png

别的不需要多说了,请大家访问GitHub亲自体验吧:

https://github.com/PaddlePaddle/PaddleSpeech

如果大家满意的话,欢迎点个小星星鼓励下我们的工程师!

6cab2fd3791531ca8f0b0a3b264dc482.png

直播课程,大牛带学

为了帮助大家了解更多语音技术前沿进展,玩转开源项目,12月21日-24日每晚20:15-21:30,由百度研究院深度学习实验室(美研)主任黄亮老师领衔,多位语音领域资深工程师为大家带来一套精品技术直播课,详解语音方向的核心技术。

扫码报名直播课,加入技术交流群

e74d84bc711ed6cacddf6902e2c2ce9b.png

精彩内容抢先看

6bc53a2b01dc0b4789f26ae55b2bf308.png

PaddleSpeech项目地址:

GitHub: https://github.com/PaddlePaddle/PaddleSpeech

Gitee: https://gitee.com/paddlepaddle/PaddleSpeech

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值