专题解读 |「知识图谱」领域近期值得读的 6 篇顶会论文

CIKM2017论文《Hike:AHybridHuman-MachineMethodforEntityAlignmentinLarge-ScaleKnowledgeBases》提出了一种人机协作方法Hike,用于解决大规模知识图谱中的实体对齐问题。该方法结合了机器学习和众包技术,旨在提高对齐质量和召回率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

CIKM 2017

fd5fbc545484a2ce4ca46253f0f6dbf898fc90d1

  • 论文 | Hike: A Hybrid Human-Machine Method for Entity Alignmentin Large-Scale Knowledge Bases
  • 链接 | https://www.paperweekly.site/papers/1528
  • 解读 | 罗丹,浙江大学硕士

1. Motivation

随着语义网络的迅速发展,越来越多的大规模知识图谱公开发布,为了综合使用多个来源的知识图谱,首要步骤就是进行实体对齐(Entity Alignment)。

近年来,许多研究者提出了自动化的实体对齐方法,但是,由于知识图谱数据的不均衡性,导致此类方法对齐质量较低,特别是召回率(Recall)。

我有几张阿里云幸运券分享给你,用券购买或者升级阿里云相应产品会有特惠惊喜哦!把想要买的产品的幸运券都领走吧!快下手,马上就要抢光了。

因此,可考虑借助于众包平台提升对齐效果,本文提出了一个人机协作的方法,对大规模知识图谱进行实体对齐。

2. Framework

方法主要流程如图所示:

97129f4e9d886cbcb7377dd4decac6ef3525641a

首先,通过机器学习方法对知识库进行粗略的实体对齐,然后分别将以对齐实体对(Matched Pairs)和未对齐实体对(Unmatched Pairs)放入众包平台,让人进行判断。

两条流水线的步骤类似,主要包括四个部分:实体集划分(Entity Partition)、建立偏序(Partial Order Construction)、问题选择(Question Selection)、容错处理(Error Tolerance)。

实体集划分的目的是将同类的实体聚类到一个集合,实体对齐只在集合内部进行,集合之间不进行对齐操作。实体集划分的依据是属性,通常同一类实体的属性是相似的。 偏序定义如下:

原文链接

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值