[事件知识图谱] EventKG: A Multilingual Event-Centric Temporal Knowledge Graph

ESWC 2018 EventKG: A Multilingual Event-Centric Temporal Knowledge Graph
Author Gottschalk, Simon,Demidova, Elena
paper https://arxiv.org/pdf/1804.04526.pdf
url http://eventkg.l3s.uni-hannover.de/

促进对网络、新闻和社交媒体上有关当代和历史事件的信息进行语义分析的关键要求之一是提供包含事件和时序关系的全面表示的参考知识库。现有的知识图谱,包括DBpedia、YAGO和Wikidata等,主要集中在以实体为中心的信息上,在事件和时序关系方面的覆盖率和完整性方面都不够。本文提出的EventKG是一个多语言的以事件为中心的时序知识图谱,解决了这个问题。EventKG包含了69万多个当代和历史事件以及230多万个时序关系,这些关系是从多个大型知识图和半结构化资源中提取出来的,并通过规范化的表示方式提供。

1 引言

动机:
有关具有全球重要性的当代和历史事件的以事件为中心的信息量,例如英国脱欧,2018年冬季奥运会和叙利亚内战等,在网络,新闻来源和社交媒体中不断增长。有效地访问和分析大规模的以事件为中心的时序信息对于语义网,自然语言处理和数字人文科学领域的各种实际应用至关重要。在语义Web和NLP中,这些应用程序包括问答[14]和时间轴生成[1]。在数字人文学科中,多语言事件库可以促进跨文化研究,旨在分析特定语言和特定社区对历史和当代事件的看法(这类研究的例子见[11]、[18])。此外,以事件为中心的知识图谱可以促进历史的重建以及随着时间的推移人们和组织的网络[19]。促进对当代和历史事件进行有效分析的关键先决条件之一是,提供有关事件,所涉及实体及其时序关系(即一段时间内有效的关系)的参考信息的知识库。

以事件为中心的现有信息源和时间信息的局限性:
当前,事件表示和时序关系分布在异构源中。首先,大型知识图谱(KGs)(即基于图的知识存储库[7],例如Wikidata [6],DBpedia [16]和YAGO [17])通常关注以实体为中心的知识。这些资源中包含的以事件为中心的信息通常不能被如此清晰地标识出来,它们可能是不完整的,并且主要限于命名事件和百科全书知识。例如,如下文第5节所述,在EventKG中包含的322669个事件中,只有18.70%使用dbo:Event在英语数据库里。此外,现有知识图中的事件描述通常缺少关键属性,例如时间和位置。例如,Wikidata中只有33%的事件提供了时间信息,而11.70%的事件提供了空间信息。其次,各种人工策划的半结构化资源(例如Wikipedia Current Events Portal(WCEP)[22]和多语种Wikipedia事件列表)都包含有关当代事件的信息。但是,这些事件中缺少事件和时序关系的结构化表示,这阻碍了它们通过语义技术直接用于现实应用中。第三,最近提出的包含从非结构化新闻源(例如[19])中提取的当代事件的知识图谱可能具有很高的噪声(例如[19]报告提取精度为0.55),尚未得到广泛采用。最后,可以在将来的工作中探索的以事件为中心的信息源是Web标记[21]和以事件为中心的网络爬虫[8]。总体而言,对于当代和历史事件及其可用于现实世界的时序关系的综合观点仍然缺失。提供EventKG将有助于克服这些限制。

EventKG&先进技术:
本文介绍的EventKG迈出了重要的一步,以促进对当前分布在以实体为中心的知识图谱和人工策划的半结构化源之间的事件和时序关系的全局视图。 EventKG 以一种有效的轻量级方式提取并整合了这些知识,并用附加的特性来丰富它,例如关系强度和事件流行度的指示,添加出处信息,并通过规范表示使所有这些信息可用。 EventKG遵循数据发布的最佳实践,并重用现有的数据模型和词汇表(如Simple Event Model [23]和DBpedia本体),通过应用语义技术和开放标准(如RDF和SPARQL),促进其在实际应用中的高效重用。 EventKG当前包括五种语言的数据源-英语(en),德语(de),法语(fr),俄语(ru)和葡萄牙语(pt)-并且是可扩展的。 EventKG的主要贡献如下:

  • 一个多语言RDF知识图谱,在V1.1中包含了超过69万个事件和230多万个时序关系,这些知识图是从几个大型的以实体为中心的知识图谱(即Wikidata、五种语言版本的DBpedia和YAGO)中提取的,以及WCEP和Wikipedia五种语言的事件列表。在下面,我们将这些用于填充EventKG的源称为参考源。EventKG的主要功能包括:
    - 提供以事件为中心的信息(包括历史和当代事件)和使用规范表示的时序关系
    - 对来自异构参考源的事件表示和关系进行轻量级集成和融合
    - 与单个参考源相比,事件表示的覆盖范围和完整性更高(见第5节)
    - 提供相互关联的信息,以便于评估关系强度和活动受欢迎程度
    - EventKG中包含的所有信息的出处
  • 一个开源提取框架,用于提取和维护EventKG的最新版本,可扩展到其他语言和参考源。

与其他现有资源的比较:
就我们所知,目前还没有专门的知识图谱来汇总与EventKG直接可比的历史和当代事件的事件中心信息和时序关系。以事件为中心和时序信息的数据模型和词汇表(如[12,19,20,23])的异构性、现有知识图谱的大规模性(事件在其中的作用微不足道)以及缺乏对以事件为中心的信息的清晰识别,使得识别、提取、融合和高效地分析以事件为中心的和时序的信息,并以直观和统一的方式使真实世界的应用程序能够访问这些信息变得很有挑战性。通过轻量级集成和融合来自不同来源的以事件为中心的时序信息,EventKG可以增加此信息的覆盖范围和完整性。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值