Mozilla成为最大公共转录语音高达18种语音

Mozilla宣布了迄今最大的多语言语音数据集,涵盖18种语言,包括英语、法语、德语和正体中文等。该数据集源于42,000人的1,400小时语音,旨在推动开放源语音识别技术的发展,挑战大厂对语音识别领域的主导地位。Common Voice项目允许多样性的语音贡献,以促进更全面的语音引擎训练。Mozilla的DeepSpeech项目利用这些数据开发语音转文字和文字转语音引擎,已被应用于多个项目,未来有望扩展到更小的设备上。" 103117890,9093794,Java泛型详解,"['JAVA 泛型', 'java基础']

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Mozilla公开现今最大的多语言语音数据集,其中收集了18种语言的语音,包括英语、法语、德语和正体中文,另外还有威尔士语和卡比尔语等,新数据集收集了来自42,000人的声音,组成1,400小时的语音片段。在2017年Mozilla启动了Common Voice群众外包计划,其目的是要收集多元语言的声音数据集,现已经成为全世界最大的人类语音数据库。虽然网络大厂、苹果及亚马逊等都打造了自己的语音识别服务,但Mozilla认为,由大厂控制的语音识别生态圈,可能阻挡其他新进入者,而且大厂通常只注重主流语言,因此Mozilla希望透过向群众募集语音,以CC 0授权供给其他想要进行语音控制研究的学术单位或是新创公司使用。Common Voice在2018年6月开始支持多语言,收集包括正体中文语音等22种语言。

Common Voice数据集不仅在数量上让其他语音数据集望尘莫及,而且语音来源遍及全球,让语音多样性更是独一无二的丰富。这些贡献者可以选择提供年龄、性别和口音等多元资料,以便提供更多的语音片段卷标给训练语音引擎使用。Mozilla提到,通常数据集都需要手动调整多样性以及男女人数比例,不然就会像TED talks的TEDLIUM语料库,因为男性演讲人是女性的3倍,导致数据集的多样性受到影响。Common Voice在2018年启动多语言支持后,现在已经收集到了22种语言的语音,最新的包括荷兰语、世界语,波斯语,巴斯克语和西班牙语。最近Mozilla还与Deutsche Gesellschaft für Internationale Zusammenarbeit(GIZ)合作,在卢旺达首都基加利的举办黑客松,为当地创建了语音数据库,帮助卢旺达开源语音技术开发。而Mozilla启动Common Voice一部分的原因,也是要供给自家的DeepSpeech项目使用,开发语音转文字和

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值