韵律词 的概念与分词类似。
韵律短语 包含韵律词,一般由韵律词和语气词组成。
语调短语 包含韵律短语,一般指一个大停顿。
摘要
语句和篇章的韵律结构和信息结构的分析以及其模型化, 是提高 语音合成自然度的关键 我们认为汉语普通话的韵律结构是分层次的, 由音步韵律词,韵律短语和语调短语组成 韵律短语可以按照感知分为两 类: minor phrase (通常短语后感知到的停顿很短, 使两个短语之间联结较 紧密)和 major phrase (通常短语后感知到的停顿很明显) 本文报告对 145 个朗读语句的韵律结构进行标注后, minor phrase 和 major phrase 的时长 特性及其音节数的统计分析结果
1 . 引言
对句子进行句法分析 可以得到它的句法成分(constituent) 当我们念这句话的时候 却 是按照其韵律结构来发音的 Selkirk(1984)提出了一种严格的韵律分层理论 她认为韵律结构 从低到高的分层依次是音步 foot 音节 syllable 音系词 phonology word (韵律词 prosodic word) 韵律音系短语 phonology phrase ( 韵律短语 prosodic phrase) 和语调短语 intonational phrase; 句子的韵律结构和句法结构之间存在着系统的影射关系 韵律结构有一些独立的完备 的原则 这些原则在我们给一个句子分配其韵律结构时 是与句法到韵律的映射原则结合使用 的(Selkirk & Shen 1988)
韵律分段结构为语音合成的自然度和可懂度提供重要信息 例如韵律分段边界将一个语句 分为几个更易处理的较小片段 对于句法上歧义的句 有些可以通过设置不同的韵律短语边界 位置来排歧 如 下雨天留客天天留我不留 (Shen 1992)
短语的边界在感知上也可以进行分类 与感知相关的物理量除了声调和语调特征以外 通 常还与这样一些语音信号的物理特征相关(李爱军 1997) 停顿(pause) 短语的最末一个音节时 长变长(final lengthening)等
在文语转换中 如果能对韵律边界位置进行精确的预测的话 就能正确分配控制各级韵律 分段的声学参数 如 F0 时长和幅度等 我们的最终目的就是要生成一个韵律分析器(prosodic parse) 对无限文本进行韵律结构和信息结构的分析 以产生最自然的语音
国外对韵律短语边界的研究很多 如采用分级随机模型或统计模型 利用语言学知识自动 预 测 韵 律 的 边 界 位 置 (Ostendorf & Veileux 1994; Sanders & Taylor 1995) 采用 CART(Classification and Regression Tree) 技术对手工标注的韵律边界和文本之间建立模型 (Hirschberg 1991) 采用随机有限状态模型对汉语进行切词(Richard & Shih 1996)
在汉语普通话韵律方面 有关于韵律词的研究(冯胜利 1997) 和关于连上变调的研究(Chilin Shih 1986 沈炯 1997) Chilin Shih 提出了汉语普通话韵律的辖阈 她认为普通话的 音步(foot)的组成分为三个步骤 先由两个直接成分(direct constituents)组成 disyllabic foot, 在 从左到右将单音节成分结合为 disyllabic foot 最后将剩下的单音节与邻近的 feet 结合 但对韵 律短语边界的研究很少 尚不清楚普通话的韵律短语的边界的声学相关量 所以 目前很难象 英语那样从语调和声调上来定义韵律短语(Pierrehumbert 1980) ,只能利用感知的方法来划分韵 律短语的边界
韵律短语按照感知分为两类: minor phrase 和 major phrase 本文报告对 145 个朗读语句的 韵律结构进行标注后 minor phrase 和 major phrase 的时长特性及其音节数的分析结果