论文笔记 ELG: An Event Logic Graph

本文介绍了一种新颖的Event Logic Graph (ELG)模型,它定义了事件的结构并用于揭示事件间的顺序、因果关系。ELG架构包括关系识别、概率计算和无/有监督因果提取,通过实验验证了其在脚本事件预测中的有效性。关键技术和实验结果展示了ELG在非结构化文本处理中的潜力。


原文链接.

Abstract

传统的知识图谱主要关注实体及其关系,忽略了现实世界中的事件。ELG可以揭示现实世界事件的进化模式和发展逻辑。

1.Introduction

本文的主要贡献有三个方面。
首先,我们是最早提出ELG定义的国家之一。
其次,我们提出了一个从大规模非结构化文本语料库中构建ELG的框架。
第三,实验结果表明,ELG能够提高脚本事件预测等下游应用的性能。

2.Event Logic Graph

2.1 Definition

ELG是一个有向无环图,它的节点是事件,边代表事件之间的顺序关系、因果关系、条件关系或上下关系。ELG本质上是一个事件逻辑知识库,揭示了现实世界事件的演化模式和发展逻辑。

2.2 Three structures of ELG

(a) 树形(b) 链式(c) 图
在这里插入图片描述

2.3 form of expression

在ELG中,事件被表示为抽象的、广义的、语义完整的事件元组E = (S, P, O),其中P是动作,S是行动者,O是执行动作的对象。在我们的定义中,每个事件必须包含一个触发词(即P),例如“run”,它主要表示事件的类型。

2.4 Abstract and generalized

事件抽象和泛化,我们不关心事件的确切参与者、地点和时间。“谁看电影”和“看哪部电影”在ELG中并不重要。语义完全性是指人们能够毫无歧义地理解事件的意义。

2.5 Relationship between Events

上下位关系
在这里插入图片描述

3.Architecture

我们提出了一个从大规模非结构化文本中构建语篇的框架。
在清理数据之后,进行一系列自然语言处理步骤,包括分割、词性标记和依赖关系解析,用于事件提取。
在这里插入图片描述

3.1 Sequential Relation and Direction Recognition

给定事件对候选对象(A, B),序列关系识别就是判断其是否具有序列关系。
如果有顺序关系,则应进行方向识别,以区分方向。
基于属性的PMI值的计算:
PMI(x, y) = p(x, y) / [ p (x) * p(y) ]
在这里插入图片描述

3.2 Transition Probability Computation

P(B|A) =f(A, B) f(A)
其中f(A, B)为事件对(A, B)的共现频率,f(A)为事件A在整个语料库中的频率。

3.3 Unsupervised Causality Extraction

构建因果关系语义表的第一步是从非结构化的自然语言文本中识别因果关系对。我们构建了一套规则来提取因果事件的提及。
每个规则遵循模板<Pattern, Constraint, Priority>,其中Pattern是一个包含选定连接器的正则表达式,Constraint是一个可以应用该模式的句子的语法约束,Priority是多个规则匹配时规则的优先级。

3.4 Supervised Causality Extraction

如图4所示,我们还使用Bert和BiLSTM+CRF模型提取因果关系。
我们用以下标记来注释句子中的每个标记:B-cause, I-cause, beeffect, I-effect和O。
我们为每个令牌i提供隐藏表示Ti作为BiLSTM的输入层。
然后将BiLSTM的输出表示层送入分类层,预测因果标签。分类层中的预测以使用CRF方法进行的周围预测为条件。

在这里插入图片描述

3.5 Event Generalization

我们建议找到语义上相似的事件(A和A ')并将它们联系起来。为此,我们提出学习每个事件的分布式表示,并利用余弦相似度来衡量两个事件向量之间的语义相似度。 在这里插入图片描述

4.Experiments

我们进行了三种实验。首先,我们识别两个事件是否有顺序关系和方向。其次,我们基于我们提出的无监督和监督方法提取事件之间的因果关系。最后,我们使用下游的任务:脚本事件预测来证明ELG的有效性。

4.1Dataset Description

我们从数据集中注释了2173个高共出现频率(≥5)的事件对。可以看到正向的实例和反向实例数量有所不同,需要抽取实例使得正负例平衡。
在这里插入图片描述
因果关系实验,我们从腾讯、网易等在线网站抓取了1362345篇中文财经新闻文献。
脚本事件预测是一项具有挑战性的基于事件的常识推理任务。我们在标准的多项选择叙述完形填空(MCNC)数据集上进行评估。

4.2Result

在这里插入图片描述
可以发现基于统计的方法效果比嵌入的方法要差。主要原因是学习事件的低维密集嵌入要比稀疏特征表示更有效,以进行脚本事件预测。点对和基于链的模型相比,基于图的模型具有更好的性能。
这证实了我们的假设,即事件图结构比事件对和链更有效,并且可以为脚本事件的预测提供更多的事件交互信息。这主要是因为结对结构,链结构和图结构各有优势,并且它们可以互相补充。

在这里插入图片描述
本文提出的模型是要更加稳定,更加优秀的。

Conclusion

我们还提出了一个从大规模非结构化文本中构建ELG的框架,并利用该框架来提高脚本事件预测的性能。ELG中使用的所有技术都是独立于语言的。因此,我们可以很容易地构建其他语言版本的ELG。

ELG文件通常与特定的日志记录或调试功能相关,尤其是在涉及语言技术和服务的平台中。分析ELG文件需要特定的工具和方法,以确保能够准确解读文件内容并提取有价值的信息。 ### 使用ELT工具解析ELG文件 如果ELG文件是用于调试音频问题的日志文件,那么可以使用ELT工具来解析。ELT工具是一种专门设计用来处理此类日志文件的软件,它可以帮助开发者和用户理解文件中记录的数据[^4]。具体步骤如下: 1. **获取ELT工具**:确保你已经获得了ELT工具的安装包或者访问权限。 2. **安装ELT工具**:按照官方文档提供的指南安装ELT工具。 3. **加载ELG文件**:启动ELT工具后,导入需要分析的ELG文件。 4. **解析和查看数据**:利用ELT工具提供的功能解析ELG文件,并查看其中记录的音频编解码信息和其他相关数据。 ### 不使用ELT工具解析ELG文件 如果不具备ELT工具,也可以尝试手动解析ELG文件。这通常涉及到对文件格式的理解以及编写脚本来解析文件内容。对于非结构化的ELG文件,可能需要依赖文本编辑器或专业的日志分析工具来打开和查看文件内容。 ### 使用编程语言解析ELG文件 对于有一定编程基础的用户,可以使用Python等编程语言来编写脚本解析ELG文件。下面是一个简单的Python代码示例,展示如何打开并读取一个ELG文件的基本内容: ```python # 打开并读取ELG文件 with open('example.elg', 'r') as file: content = file.read() print(content) ``` 这段代码仅适用于文本格式的ELG文件。如果是二进制格式,则需要使用不同的方法来读取和解析。 ### 分析ELG文件中的语言技术数据 当ELG文件包含的是语言技术相关的数据时,可以利用ELG平台提供的服务进行分析。这些服务可能包括自然语言处理、端到端应用程序等,它们能够帮助用户测试和分析语言技术[^2]。 ### 脚本事件预测 在某些情况下,ELG文件可能与脚本事件预测有关,这种情况下可以采用无监督或有监督的方法来提取事件之间的关系,进而用于下游任务如脚本事件预测[^3]。 ### 相关问题 1. 如何在没有ELT工具的情况下解析ELG文件? 2. ELG平台提供的自然语言处理服务有哪些具体应用场景? 3. 在使用Python解析ELG文件时需要注意哪些问题? 4. 脚本事件预测是如何利用ELG文件中的数据的? 5. ELG文件中的音频调试信息对于解决实际问题有何帮助?
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值