去年了解了依存句法分析,今年来学语义依存分析(Semantic Dependency Parsing, SDP)。
依存分析是为了让机器理解自然语言,而开创设计的方法。那么如何做呢?
一般是有下面这个顺序:将原始文本自底向上分词->词性标注->命名实体识别->句法分析(比如之前学习的依存句法分析)->语义分析(若要机器进一步理解语言)
语义依存分析:
官方解释:分析句子各个语言单位之间的语义关联,并将语义关联以依存结构呈现。使用语义依存刻画句子语义,好处在于不需要去抽象词汇本身,而是通过词汇所承受的语义框架来描述该词汇,而论元的数目相对词汇来说数量总是少了很多的。语义依存分析目标是跨越句子表层句法结构的束缚,直接获取深层的语义信息。
形象描述:语义依存分析的目的即回答句子的”Who did what to whom when and where”的问题。例如句子“张三昨天告诉李四一个秘密”,语义依存分析可以回答四个问题,即谁告诉了李四一个秘密,张三告诉谁一个秘密,张三什么时候告诉李四一个秘密,张三告诉李四什么。

上图中表示语义的形式为依存形式,其优势在于形式简洁,易于理解和运用。语义依存分析建立在依存理论基础上,是对语义的深层分析。可分为两个阶段,①根据依存语法建立依存结构,即找出句子中的所有修饰词与核心词对,②对所有的修饰词与核心词对指定语义关系(后面介绍)。可见,语义依存分析可以同时描述句子的结构和语义信息。
拓展:语义分析可以跨越句子的表层结构直接获取深层语义表达的本质,例如句子:“张三吃了苹果”、“张三把苹果吃了”和“苹果被张三吃了”,虽然它们的表述形式不同,但含义相同,吃和张三、吃和苹果之间的语义关系稳定不变,这在词义消歧、信息检索、机器翻译等诸多领域有重要作用。
语义依存图:
在语义依存分析中,我们通常采用图代替树(依存图代替依存树)
ps:回顾一下,还记得依存语法中关于依存关系的四条公理吗?
1.一个句子中只有一个成分是独立的;
2.其它成分直接依存于某一成分;
3.任何一个成分都不能依存与两个或两个以上的成分;
4. 如果A成分直接依存于B成分,而C成分在句中位于A和B之间,那么C或者直接依存于B,或者直接依存于A和B之间的某一成分;
ps over~
回过头来,我们采用依存图进行语义依存分析时,必要时可突破四条公理的部分(单一父节点,关系弧无交叉),这样的突破使得对连动、兼语、概念转位等汉语中常见的现象的分析更全面深入。
举个例:

依存树VS依存图:

比较依存句法分析和语义依存分析:
语义依存分析不受句法结构的影响,将具有直接语义关联的语言单元直接连接依存弧并标记上相应的语义关系。这也是语义依存分析与句法依存分析的重要区别。见下图:蓝色线表示的句法依存分析的依存结构,绿色线就是语义依存分析的依存结构。

具体分析上图中不同分析方法的区别:
依存句法更在意没有实际含义的词语,在句子结构中的作用(比如介词的在,助动词用,标点符号等),而语义依存更倾向在具有直接语义关联的实词之间建立直接依存弧,非实词作为辅助标记存在。(小m开头的均为辅助词的存在)
两者依存弧上标记的语义关系完全不同,语义依存关系是由论元关系引申归纳而来,可以用于回答问题,如我在哪里喝汤,我在用什么喝汤,谁在喝汤,我在喝什么。但是句法依存却没有这个能力。
句法依存的限制:
句法依存按照句法结构功能建立依存关系并为依存结构标注句法关系,更强调介词、助词等对句法结构划分的作用。而语义依存如前所说,注重实词之间语义事实上或逻辑上的关系。而句法的结构往往随着字面词语的变化而不同,相反语义则能够跨越句子表层的变化直达语义的本质。

以上两句语义相同,而表达形式不同,导致句法结构不同
语义依存VS语义角色标注:
语义角色标注是一种流行的语义分析的任务,语义角色标注同样能够转化为依存结构。语义角色标注是给定一个句子,分析该句中特定动词的论元结构,找出和特定动词搭配的论元并分析其语义角色。角色分为施事、受事、与事等核心角色和地点、时间、行为方式等附属角色。语义角色标注是浅层语义分析的一种主要实现方式,是深层语义分析的简化和基础。
从另一个角度比较语义角色标注和语义依存分析,语义角色标注的自动分析需要以句法分析为基础,句法分析的错误会带入到语义角色标注中。而语义依存分析,直接在基本语言处理基础上一步走到比语义角色标注更深层的语义分析阶段,这个过程在一步中完成将极大减少错误的级联。这表明语义依存分析的另一个优势。(结构见下图)

附件1:关系表
语义依存关系分为三类,分别是主要语义角色,每一种语义角色对应存在一个嵌套关系和反关系;事件关系,描述两个事件间的关系;语义依附标记,标记说话者语气等依附性信息。
关系类型 |
Tag |