Mozilla开源语音收集计划Common Voice扩大支持汉语普通话

Mozilla 的 Common Voice 语音数据收集平台现支持汉语普通话,旨在建立全球化开源语音数据库,促进语音识别技术发展。已有超过 4.2 万贡献者的 18 种语言录音,总计近 1,400 小时数据,目标积累约 1 万小时的汉语普通话音频。该项目鼓励公众参与录音或验证,以推动技术进步。" 110333508,10296216,Python ARIMA模型预测餐厅销量:时间序列分析与实践,"['Python', '时间序列预测', 'ARIMA', '数据分析', '餐厅销售预测']

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

开发开源 Firefox 浏览器的非营利组织 Mozilla 宣布,其所推动地最大语音数据收集计划——Common Voice** 平台已正式支持汉语普通话。**在广大的 Mozilla 社群及语言专家伙伴的辛勤努力下,从现在开始,网友可到 Common Voice 的简体中文网站(https://voice.mozilla.org/zh-CN)录制音频。

● Mozilla 开始收集大陆地区汉语语音数据,更进一步充实其公开语音数据集

● 现已收集 27 种不同语言的语音文件,并将再扩大支持 72 种语言

● Common Voice 是史上最大的开源语音转录文字数据集,其最新发布的数据库包括来自超过 4.2 万贡献者的 18 种语言录制的语音文件,总长近 1,400 小时

语音接口是互联网未来的大势所趋。车载语音助理、智能手表、智能灯泡等等……内建语音识别技术的设备可谓与日俱增。然而,相关技术的创新仍面临着重大阻碍:有意打造语音辅助方案的创新公司、研究人员或各种开发者都需取得大量转录为文字的语音数据,才能训练机器学习的算法。但现有公开语音数据集的语音数据量与支持语种数都极其有限,而私有的语音数据不但仅掌握在少数几家公司手中,其费用还很高。

因此,Mozilla 自 2017 年 6 月起展开

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值