Raiman2018OpenAI_DeepType: Multilingual Entity Linking by Neural Type System Evolution
简介
- 论文的工作主要可以归纳为两件事:
- 给出了自动构建 t y p e type type 系统(或者说概念本体)的方法
- 利用这个 t y p e type type 系统进行实体链接
- 官方代码
1. 任务详解
1.1 术语
- 关系:给定知识图谱或特征集,关系是一组可继承的规则,用于定义属于/不属于某个特定群组。
比如 c i t y city city 是一个根, i n s t a n c e _ o f ( c i t y ) instance\_of(city) instance_of(city) 是一个关系,从而有实体通过关系与根相连,比如南京、上海
- t y p e type type:由关系定义的一个类别
比如 I s C i t y IsCity IsCity 就是一个 t y p e type type,包含所有与 c i t y city city 通过 i n s t a n c e _ o f ( c i t y ) instance\_of(city) instance_of(city) 相连接的实体
- t y p e type type 轴:一系列互斥关系
比如 I s C i t y ∩ I s H u m a n = { } IsCity∩IsHuman=\{\} IsCity∩IsHuman={ }
- t y p e type type 系统:一系列 t y p e type type 轴, A A A,外加一个 t y p e type type 标签函数: { t 1 , . . . , t k } = T y p e L a b e l e r ( e , A ) \{t_1,...,t_k\}=TypeLabeler(e,A) {
t1,...,tk}=TypeLabeler(e,A)
比如包含两个轴 { I s A , T o p i c } \{IsA,Topic\} { IsA,Topic} 的 t y p e type type 系统,南京对应的就是 { 城 市 , 地 理 } \{城市,地理\} { 城市,地理}
1.2 整体架构
- 为了构建一个基于 D e e p T y p e DeepType DeepType 的实体链接模型,我们需要3个组件:
- 一个 t y p e type type 系统
在本论文中, t y p e type type 系统中的所有 t y p e type type 被限制为wiki百科本体中的父子关系。例如 r = h u m a n , e = i n s t a n c e _ o f r=human,e=instance\_of r=human,e=instance_of,从而将实体分为 h u m a n human human 和 n o n − h u m a n non-human non−human 两类
- 一个对应于该 t y p e type type 系统的 t y p e type type 分类器
- 一个用于在给定mention时,预测实体的模型。作者用的 L i n k C o u n t ( e , m ) LinkCount(e,m) LinkCount(e,m)
- 一个 t y p e type type 系统