论文阅读Knowledge Vault

题目归属及框架

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

前言

谷歌公司正在打造人类历史上最大的知识库Knowledge Vault

这个被冠以Knowledge Vault之名的知识库无需任何人工干预,就能自动搜集源自互联网的信息并将其整合成单一的事实库,内容涉及世界、人物以及相关对象。这种知识采集机制达到的广度和精度,正在日益成为各种便于机器人和智能手机理解人们对其提问的系统的基础。它有望让“谷歌”超越搜索引擎功能,像“甲骨文”(Oracle)数据库那样回答问题,甚至还能从新的视角来考察人类历史。

这在篇文章中,作者分析了knowledge vault(KV)知识库这一自动化的过程是如何运转的。

概述

当今世界上已经存在了很多成熟的知识库,但要使知识库的规模更大,需要探索一种自动化的方法来构建数据库。因此,作者在本文提出了一种web规模的概率知识融合方法,将从web上抽取的资源与现有的知识库(如freebase)相结合,并使用了监督学习。正因如此,KV的规模以以往的知识库都要来的大。

关键词:知识库;知识抽取;概率方法;机器学习

动机

  • 现有的知识库虽然到达了比较大的规模,但仍具有不完整性,例如Freebase中,71%的人没有出生地。

  • 直接从web资源上摘录下来的信息,具有较大的噪声,数据无法直接利用,有很多可信度不高。

贡献

  1. 使用已有知识库里的先验知识,与web上爬取下来的带有噪声的数据相结合。利用已有的三元组,经过知识推理判断新三元组的正确性,先验概率模型的出现解决了抽取过程中出现错误的问题。
  2. KV的规模比相同的知识库大。
  3. 对不同的抽取方法及先验概率方法进行了详细的比较。

KV组件

  • 抽取器Extractors:负责从web资源抽取知识,每个抽取器会对实体分配一个置信分数,以此表明该三元组的正确率
  • 基于图的先验概率模型Graph-based priors:负责基于已有的知识库,来计算每个三元组的先验概率
  • 知识融合Knowledge fusion:负责基
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

CodeSlogan

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值