口语语言系统与语料库设计指南
1. 非语音声学事件分类与标注
非语音声学事件可分为两类。第一类包括咂嘴声、咕噜声、笑声、沉重的呼吸声和咳嗽声;第二类包括关门声、电话铃声、狗叫声以及其他说话者发出的各种噪音。例如,Switchboard语料库涵盖了从鸟叫到呻吟和打哈欠等非常广泛的非语音声学事件列表。
对于这些非语音声学事件的标注,建议先转录单词,然后指出哪些单词与声学事件同时发生,从而将这些事件标注在话语中的正确位置。
2. 同时说话与说话轮次处理
2.1 同时说话
在对话和访谈中,可以标注两个或更多说话者同时说出的单词,这有助于更准确地呈现对话的真实场景。
2.2 说话轮次
话语分析会利用不同说话轮次和主动性的指示。虽然这些在语音技术中通常不常用,但转录它们是可行的,这对于研究对话结构和交流模式具有重要意义。
3. 转录建议列表
3.1 多说话者对话转录
对于两个以上说话者之间的对话转录,建议使用“乐谱符号”,这种方式能够清晰地展示不同说话者的话语顺序和重叠情况。
3.2 正字法转录
在正字法转录中,应尽可能使用标准拼写,以保证转录的规范性和通用性。
3.3 缩写词形式标注
在正字法转录中,如果缩写词形式频繁出现且涉及音节删除,则应进行标注,以便更准确地反映语言的实际使用情况。
3.4 填充音节使用
至少使用两种类型的“填充”音节:一种是类似元音的“uh”,另一种是鼻音的“mm”,这些填充音节
超级会员免费看
订阅专栏 解锁全文
12

被折叠的 条评论
为什么被折叠?



