10、口语语料库收集全解析

口语语料库收集全解析

1. 口语语料库设计要点

不同国家和文化在口语语料库设计的某些方面可能存在较大差异。每个语音识别系统应能处理中上层阶级在正式场合讲话时的方言影响。对于不太正式场合或下层阶级正式讲话中的方言影响的涵盖程度,很大程度上取决于识别器的应用场景。此外,特定情境下对方言口语的社会接受度也是一个极其重要的因素,在一个国家的不同地区,这种接受度可能差异很大。

若电话应用设计为来自特定地区的所有通话都在当地中心处理,那么只要能收集到合适的训练语料库,就可以设计适应当地方言的识别系统。在通过电话随机收集语音语料时,需要明确规定判断特定说话者的语言是否偏离“标准”太多,以决定是否将其纳入语料库。非母语者的语音可视为一种特殊的“社会方言”,有些非母语者说居住国的标准语言时只有轻微口音,而另一些则口音浓重或词汇、语法掌握较差。对于前者,没有理由将其排除在通用语音语料库之外;而对于后者,除非研究专门针对非母语语音或要构建“通用”语音语料库,否则最好排除。

设计语音语料库时,要牢记语料库的目的决定其类型和设计。明确特定目标后,首先要确定待收集语料库中必须包含的信息类型。需要考虑的问题既包括一般性的,如录音类型(如高保真或电话录音),也包括更详细的,如是否有必要在一天的不同时间收集语音。可收集的语音材料类型丰富,从孤立音到自发对话均有涉及,同时在选择说话者的数量和类型时也有诸多问题需考虑。

2. 语音数据收集的维度

语音数据收集可从以下维度进行描述:
|维度|具体内容|
| ---- | ---- |
|可见性|公开 - 秘密|
|环境|工作室 - 实地|
|控制/交互|随机录音 - 朗读语音|

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值