1、(空)
2、(空)
3、句法分析(syntactic parsing)是自然语言处理中的关键技术之一,其基本任务是确定句子的句法结构(syntactic structure)或句子中词汇之间的依存关系。 一般来说,句法分析并不是一个自然语言处理任务的最终目标,但是,它往往是实现最终目标的重要环节,甚至是关键环节。
4、句法分析分为句法结构分析(syntactic structure parsing)和依存关系分析(dependencyparsing)两种。5、句法结构分析又可称为成分结构分析(constituent structure parsing)或短语结构分析(phrase structure parsing)。
6、以获取整个句子的句法结构为目的的句法分析称为完全句法分析(full syntactic parsing)或者完全短语结构分析(full phrase structure parsing)(有时简称full parsing)。
7、而以获得局部成分(如基本名词短语(base NP))为目的的句法分析称为局部分析(partial parsing)或称浅层分析(shallow parsing)。
8、依存关系分析又称依存句法分析或依存结构分析,简称依存分析。
9、句法结构分析是指对输入的单词序列(一般为句子)判断其构成是否合乎给定的语法,分析出合乎语法的句子的句法结构。
10、句法结构一般用树状数据结构表示,通常称为句法分析树(syntactic parsing tree),简称分析树(parsing tree)。
11、完成这种分析过程的程序模块称为句法结构分析器(syntactic parser),通常简称为分析器(parser)。
12、句法结构分析的任务有三个:①判断输入的字符串是否属于某种语言;②消除输入句子中词法和结构等方面的歧义;③分析输入句子的内部结构,如成分构成、 上下文关系等。
13、有时人们也将句法结构分析称为语言或句子识别。
14、词法歧义和结构歧义等各种类型的歧义在自然语言中普遍存在,而句法结构歧义的识别和消解是句法分析面临的主要困难。
15、构造一个句法分析器需要考虑两部分工作:一部分是语法的形式化表示和词条信息描述问题。 形式化的语法规则构成了规则库,词条信息(包括词性、 动词的配价和中心词信息等)由词典或相关词表提供,规则库与词典或相关词表构成了句法分析的知识库;另一部分工作是分析算法的设计。
16、语法形式化(grammar formalism)属于句法理论研究的范畴。 目前在自然语言处理中广泛使用的是上下文无关文法(CFG)和基于约束的文法(constraint-based grammar)的简单形式,后者又称为合一语法(unification grammar)。
17、常用的基于约束的语法有:功能合一语法(FUG)、树链接语法(TAG)、词汇功能语法(LFG)、广义的短语结构语法(GPSG