进行统计自然语言处理系统梳理,学习资料《统计自然语言处理.宗成庆》
篇章分析的最终目标是从整体上理解篇章,最重要的任务是分析篇章结构。篇章结构包括:语义结构,话题结构,指代结构等。
一、基本理论
概念依存理论。
Beaugrandeand Dressler(1981)认为篇章有7个基本特征:衔接性,连续性,意图性,信息性,可接受性,情景性和跨篇章性。其中衔接性,连续性,意图性和信息性对自然语言产生了很多影响。
言语行为理论。
中心理论。
修辞结构理论。
脉络理论。
篇章表示理论。
二、篇章衔接性
衔接又称为外部联结,主要表现为整个篇章范围内词汇或短语之间的关联。当语篇中一个成分的含义依赖于另一个成分的解释时,便产生衔接关系。
Hallidayand Hasan(1980)将衔接分为五种情况:一般指代,替换,省略,连接和词汇衔接。目前的研究主要集中在指代消解方面和词汇衔接方面的衔接性相关研究。
指代一般包括两种情况:回指和共指。二者之间有很大的交集,但并不严格地彼此地包含。
词汇衔接方面。
整体上篇章衔接性研究还处于初步或停留于问题本身。
三、篇章连贯性
连贯性又称内部联结,主要通过句子之间的语义关联来表示篇章不同部分之间的关联关系。这方面主要针对信息性和意图性进行展开。