
知识图谱
CopperDong
纯属巧合
展开
-
知识图谱项目汇总
Experiments of developing an IRTG which simultaneously encodes transformations between phrase structure trees, dependency graphs and semantic graphs. 中文关系抽取基于深度学习的中文关系抽取框架 distant supervised rel...原创 2019-10-16 18:00:00 · 2281 阅读 · 0 评论 -
图数据库:2 关联数据的存储选择
我们生活在互联的世界中。为了发展进步,我们需要理解并影响所处的网络。2.1 关系型数据库缺少联系 数十年来,开发者试图使用关系型数据库处理关联的、半结构化的数据集。关系型数据库设计之初是为了处理纸质表格以及表格化结构---有些方面关系型数据库做得非常好---它们试图对这种实际中的特殊联系进行建模。然而讽刺的是,关系型数据库在处理联系上做得却并不好。 下图展示了一个以客户原创 2017-12-19 11:27:59 · 603 阅读 · 0 评论 -
图数据库:1 简介
第一章 简介图论图是什么:实体与实体之间的关联Gartner定义了商业世界的5个图-----社交、意向、消费、兴趣和移动,并指出运用这些图的能力是一个”可持续的竞争优势“。现在最流行的图模型----带标签的属性图:它包含节点和联系节点上有属性(键值对)节点可以有一个或多个标签联系有名字和方向,并总是有一个开始节点和一个结束节点联系也可以有属性1.2 图领原创 2017-12-19 11:25:24 · 1741 阅读 · 0 评论 -
知识图谱构建摸索
一、前言知识图谱(Knowledge Graph)突然就变得很热门,自己也被分配去研究构建知识图谱了,中间也看了很多资料,这里想做个小笔记,方便日后的查阅和备忘吧!二、什么是知识图谱?构成这个世界的是实体,而非字符串(things, not strings)。知识图谱其实就是以前的语义网,只不过换了一个名字而已。知识图谱就是把所有不同种类的信息(He转载 2017-12-18 20:04:02 · 1402 阅读 · 0 评论 -
本体建模与语义Web知识发现 3 基于关系数据库的XML文档管理
设计数据库时,要分析存储的信息及这些信息组成部分之间的关系。传统的关系数据库采用ER模型来描述数据关系,并依此进行数据库设计。XML文档是半结构化数据,ER图不能完全体现数据之间的关系,所以首要解决的是XML数据库的数据模型问题。3.1 XML数据模型 研究者也开展了大量基于关系模型的XML数据管理的研究工作。这些方法的最大问题是:XML数据上的一个操作需要用这些模型上的一系列操作来原创 2017-12-27 10:12:24 · 444 阅读 · 0 评论 -
本体建模与语义Web知识发现 2 XML与数据库
XML本身不能和数据库挂上钩,但是加上一些其他的辅助工具,就把整个XML看成是一个数据库系统,XML文本本身可以看成是数据库中的数据区,DTD或Schema可以看成是数据库模式,XQL(XML查询语言)可以看成是数据库查询语言,SAX或DOM可以看成是数据库处理工具。当然它还是缺少数据库所必须的一些东西,比如有效的存储组织、索引结构、安全性、事务处理、数据完整性、触发器、多用户处理机制等等。原创 2017-12-27 09:54:24 · 471 阅读 · 0 评论 -
图数据库:3 使用图进行数据建模
无论是与其他NoSQL存储相比,还是与传统的关系型数据库相比,图数据库都具有显著的好处。但是一旦选择了图数据库,接下来我们就会问:如何使用图来建模呢?3.1 模型和目标 建模是为了让不规则的领域的一些具体方面变成结构化的、可操纵的空间。对于事物实际存在的方式,并没有一种天然的表达方式,我们只能有目的地选择、抽象和简化,一些方法能更好地满足某个特定目标。 在这方面,用原创 2017-12-19 16:12:14 · 3001 阅读 · 0 评论 -
csv文件导入Neo4j(包括结点和关系的导入)
首先,Neo4j打开的目录地址(即数据库data存放的地址)如下图:在此目录下创建一个import文件,文件夹里面存放需要载入的csv文件,因为Neo4j默认是从打开地址目录(F:\Eclipse_AF\Neo4jTest\neo4j_data)下的import中读出,所以需要在此目录下创建csv文件,否则在Neo4j中执行载入命令会出现找不到文件的情况。(person_For转载 2018-01-01 16:26:02 · 5424 阅读 · 0 评论 -
Neo4j安装及使用shell脚本执行命令
Neo4j是一个图形化的数据库,可以很直观的看到各种数据之间的关系。1、在Linux中安装Neo4j可以在官网上下载需要的版本:https://neo4j.com/download/我下载的是:neo4j-community-3.0.3-unix.tar.gz保存到Linux中然后执行命令解压:tar -xzvf neo4j-community-3.0.3-unix转载 2017-12-31 21:56:37 · 2886 阅读 · 0 评论 -
本体建模与语义Web知识发现 4 基于频繁模式挖掘的XML网页分类技术
要实现Web的分类检索,首先解决网页分类问题。XML文档是文本内容信息与结构信息的综合体,区别于传统的文本分析的关键在于结构信息的获取与利用,针对一般文件的分类方法不但体现不出XML文件的优点,更可能使得分类效果相对于普通文本效果更差,因此有必要研究一种专门针对XML文档的分类方法。原创 2017-12-28 09:58:35 · 530 阅读 · 0 评论 -
本体建模与语义Web知识发现 5 基于N-VSM的全文检索
信息检索是从任何信息集合中识别和获取所需信息的过程及其所采取的一系列方法和策略。从原理上看,包括存储与检索两方面。知识是有组织的大量的信息,获得知识有赖于获得信息。本章将介绍非结构化数据的全文检索技术。5.1 全文检索的关键技术 由于RDBMS自身底层结构的缘故使得它管理大量非结构化数据显得有些先天不足,特别是查询这些海量非结构化数据的速度较慢。而通过全文检索技术就能高效地管理这些非原创 2017-12-28 11:43:18 · 772 阅读 · 0 评论 -
本体建模与语义Web知识发现 6 领域知识的描述与本体建模
自然语言一直是一种有效的表示知识和交流知识的有效方法,然而计算机网络环境下的知识库系统却不能用自然语言来表示知识,根本原因是它的二义性和缺乏一致性的结构。要实现计算机自动处理知识并对知识问题进行求解,必须准确描述知识,以某种一致化的结构存储和组织知识。根据本体论的基本观点,任何复杂事物都可以从中剥离出事物的本质,也就是事物的最小化描述,即本体。随着语义网技术的发展,基于可扩展标记语言(XML)的D原创 2017-12-29 12:11:32 · 3912 阅读 · 1 评论 -
Windows上安装Stardog
原文Stardog是一个企业级的知识图谱数据库。使用Stardog,你可以统一、查询、搜索和分析所有数据。下面是安装过程。1、安装环境操作系统:Win10 64位注意:Stardog在Java 8上运行,最好是64位的JVM,不是也没关系。2、下载进入Stardog官网(https://www.stardog.com/),点击“DOWNLOAD” 填写如下信息,注意邮箱是...转载 2018-12-28 15:04:43 · 613 阅读 · 0 评论 -
知识图谱表示学习与关系推理(2016-2017)(一)
笔者:整理2016-2017年ACL、EMNLP、SIGIR、IJCAI、AAAI等国际知名会议中实体关系推理与知识图谱补全的相关论文,供自然语言处理研究人员,尤其知识图谱领域的学者参考,如有错误理解之处请指出,不胜感激!(如需转载,请联系本人:jtianwen2014,并注明出处)https://www.cnblogs.com/jtianwen2014/p/7000190.htmlA...转载 2018-09-07 15:34:20 · 5367 阅读 · 0 评论 -
知识图谱入门 (七) 知识推理
https://blog.youkuaiyun.com/pelhans/article/details/80091322知识推理简介知识推理任务分类所谓推理就是通过各种方法获取新的知识或者结论,这些知识和结论满足语义。其具体任务可分为可满足性(satisfiability)、分类(classification)、实例化(materialization)。可满足性可体现在本体上或概念上,在本体上...转载 2018-09-07 15:29:03 · 3179 阅读 · 0 评论 -
protege 5.0 教程
1.下载下载地址http://protege.stanford.edu/download/protege/4.3/installanywhere/Web_Installers/,目前版本信息Protégé Desktop 4.3(2014/2/20)。根据机器选择相应的平台,这里选择Windows 64bit。如果你的机器上已经安装了java vm只需要下载without Java VM2...转载 2018-09-07 15:16:19 · 2461 阅读 · 2 评论 -
OWL本体语言和Protege本体编辑器
OWL本体语言和Protege本体编辑器演讲稿原作者:Wala Abdulaziz译者:Wu Di (pimgeek)转载、编辑:Tan Liwei原文发布日期:2013年6月5号原文链接:https://prezi.com/ggozsbzy2xn-/owl-protege/什么是本体(Ontology)? 在计算机科学和信息科学中,本体的作用是表达知识.在本体中,知识可...转载 2018-09-07 15:13:59 · 4254 阅读 · 0 评论 -
用Wikidata做实体搜索的两种方案
用Wikidata做实体搜索的两种方案Wikidata 是一个可协同编辑的知识库,是继2006年的维基学院之后,第一个新的维基媒体基金会项目。这一项目与维基共享资源的工作方式类似,将为其他维基计划及各语种维基百科中的信息框、列表及跨语言链接等提供统一存放的数据,该项目在2012年10月30日投入使用。Wikidata 的所有数据都是对外公开的,官网对外提供了两类数据获取方式:在线API和数据库下载...转载 2018-03-15 20:16:37 · 3460 阅读 · 4 评论 -
知识图谱相关会议之观后感分享与学习总结
2015年6月27日,清华大学FIT楼多功能报告厅,中国中文信息学会青年工委系列学术活动——知识图谱研究青年学者研讨会。 由于我毕设是与知识图谱、实体消歧、实体对齐、知识集成相关的,所以去听了这个报告;同时报告中采用手写笔记,所以没有相应的PPT和原图(遗憾),很多图是我自己画的找的,可能存在遗漏或表述不清的地方,请海涵~很多算法还在学习研究中,最后希望文章对大家有所帮助吧!感谢转载 2017-11-07 22:07:35 · 895 阅读 · 0 评论 -
本体建模与语义Web知识发现 7 万维网信息资源的描述与发布
XML是结构化标记语言,即实现“文档结构化”的语言规范,是与特定领域有关的、具有语义和结构化等特点的元标记语言。XML将文件的内容和外观进行分离,其所具有的可延伸性及自我描述特性,使得Web文件可以在全球信息网或企业间的应用程序中自动传输、处理及存储,不同厂商的电子商品目录可以共享,信息的搜索变得更为准确快速,不同系统间的信息流通更加顺畅,给Web应用乃至网络计算注入了新的活力。7.1 XML原创 2017-12-30 11:50:52 · 571 阅读 · 0 评论 -
本体建模与语义Web知识发现 1
第1章 基于语义Web的智能检索和知识发现 语义Web不是另外一个Web,它是现有Web的延伸,其中信息被赋予了良定义。语义Web将在更加微小的信息之间建立直接的连接,例如一条街道的地址与一份地图等,用户可以将两个毫不相干的东西连接在一起,比如说银行报账单和日历。用户可以将银行报账单拖到日历上,也可以将日历拖到银行报账单上,这样就可以知道何时进行支付。语义Web将呈现给人们一个所有数据“原创 2017-12-26 09:25:54 · 1319 阅读 · 0 评论 -
本体建模与语义Web知识发现 9:基于本体知识库的知识发现
目前在Web上进行的信息检索主要是利用搜索引擎,进行基于字符的关键字匹配检索。尽管搜索引擎在一定程度上避免了用户浏览网络信息的盲目性,给用户带来了便利,但是这种检索方式的主要问题是在返回大量不相关的结果的同时却又漏掉了一些相关页面,在很大程度上无法满足用户的需求。面对网络信息量的激增,传统的基于信息定位的Web信息表示方法,使得现有信息检索面临前文中所述的困难和窘境。而语义Web是目前一个较好的、原创 2017-12-31 11:47:57 · 1637 阅读 · 0 评论 -
语义网基础教程 (第一版)3 用RDF描述网络资源
第三章 用RDF描述网络资源 XML并没有提供任何表示数据语义的手段。假定要表示“David Billington讲授离散数学课程”,使用XML,这句话有多种表达方式。所以XML没有为标签嵌套的含义制定任何标准。 虽然资源描述框架(Resuouce Description Framework,RDF)通常称为一种“语言”,但它实际上是一个数据模型。它有一系列原创 2017-12-11 17:23:20 · 743 阅读 · 0 评论 -
语义网基础教程 (第一版)2 XML结构化网络文档
第2章 XML结构化网络文档 HTML源于SGML(标准通用标记语言),是目前书写网页的标准语言,定义一种独立于设备和系统且人机均可读的信息表示方法。引入它的原因是SGML对于和因特网相关的某些用途过于复杂。为了克服HTML的一些缺陷,另一种SGML应用-XML(可扩展性标记语言)应运而生。 You V.Marek Spinger 19原创 2017-12-11 16:30:16 · 444 阅读 · 0 评论 -
语义网基础教程 (第一版) 1 语义网概览
第一章 语义网概览 基于关键词的搜索引擎,是使用现有万维网的主要工具。毫无疑问,假如没有这些搜索引擎,万维网不会取得现在这么大的成功。然而,搜索引擎的使用也存在一些严重的问题:(1)高匹配、低精度。即使搜到了主要相关页面,但它们与同时搜到的28758个低相关或不相关页面混在一起,检索的效果就很差。太多和太少一样令人不满意。(2)低匹配或无匹配。有时用户得不到任何搜索结果,或原创 2017-12-11 12:08:26 · 874 阅读 · 0 评论 -
图数据库:4 构建基于图数据库的应用
根据经验来说,图数据库应用程序非常适合使用演化的、增量的、迭代的软件开发实践方法进行开发,这种方法如今被广泛应用。这些实践的一个关键特性是:在整个软件开发生命周期中贯穿着测试。在这里我们将展示如何使用测试驱动的方式来开发数据模型和应用程序。4.1 数据建模 用节点表示事物,用联系表示结构 细粒度联系与通用联系 将事实建模为节点原创 2017-12-20 09:19:23 · 1125 阅读 · 0 评论 -
万维网之父Tim Berners-Lee 获得2016年度图灵奖
作者:硅谷密探链接:https://www.zhihu.com/question/58037961/answer/155413736来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。这个拒绝成为比尔盖茨的“互联网之父”,今天拿下了计算机届的诺贝尔奖!也许你还依稀记得2012年伦敦奥运会开幕式上,那个坐在复古的NeXT电脑前,在自己发明的万维网转载 2017-12-11 10:08:59 · 2482 阅读 · 0 评论 -
知识图谱构建技术综述
知识图谱的定义与架构知识图谱的定义知识图谱是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系。其基本组成单位是“实体-关系-实体”三元组。通过知识图谱,可以实现Web从网页链接向概念链接的转变。知识图谱的架构从逻辑上可以划分为2个层次:数据层和模式层。在知识图谱的数据层,知识以事实(fact)为单位存储在图数据库。图数据中有“实体-转载 2017-12-09 14:01:08 · 1965 阅读 · 0 评论 -
基于知识图谱的电影自动问答系统(二)自动问答实现
自动问答的流程我们的自动问答主要流程按问题的抽象与分类、问题的扩展与抽取、答案的生成展开。问题的抽象与分类主要用于确立问题的意图,问题的扩展与抽取主要是将问题扩展并转化为标准模板,以便抽取。答案的生成主要是将抽取的实体构建实体链,然后访问图形数据库,以求答案。问题的抽象首先,我们主要采以 Hanlp 提供的通用型命名实体工具包,并添加部分人工标注的命名实体,其添加的转载 2017-12-09 13:56:44 · 993 阅读 · 0 评论 -
基于知识图谱的电影自动问答系统(一)知识的获取与存储
引言这学期上自然语言处理课,老师需要我们合作完成一项大作业。当时的我早已对知识图谱感兴趣,有种跃跃欲试的冲动。正好逢上这样的一次机会,所谓初生牛犊不怕虎,我就报上了“基于知识图谱的电影自动问答系统”。但是我后来才发现,这项目的难度真的挺大,要做好不容易呀。关于本体、知识库、知识图谱本体(Ontology),是知识库本身的存在。维基百科的定义是“a formal转载 2017-12-09 13:56:13 · 1605 阅读 · 1 评论 -
语义网基础教程 (第一版)4 网络本体语言OWL
第四章 网络本体语言OWL RDF和RDF Schema的表达能力还非常有限,RDF局限于二元常谓词,RDFS局限与子类分层和属性分层,以及属性的定义域和值域限定。 然而万维网联盟(W3C)网络本体工作组确定的一些语义网特征用例所需要的表达能力更强。 美国和欧洲的许多研究机构意识到需要更为强大的本体建模语言,并联合提出了一个语言DAML+OIL,作为网络本原创 2017-12-11 17:51:38 · 1281 阅读 · 0 评论 -
语义网基础教程 (第一版)5 逻辑和推理:规则
第五章 逻辑和推理:规则 从抽象的观点看,前面几章的主题是与知识表示相关的,包括关于网上资源内容的知识和关于应用领域中的概念及其相互关系的知识(本体) 早在万维网出现之前,人工智能领域就研究过知识表示。哲学领域对相关课题的研究更早,甚至可以追溯到古希腊。亚里士多德被认为是逻辑学之父,而逻辑特别是谓词逻辑(又称为一阶逻辑)一直是知识表示的基础。这里,列出一些使得逻原创 2017-12-11 20:12:10 · 1685 阅读 · 0 评论 -
语义网基础教程 (第一版)6 应用
语义网技术的各种用途给出一个广泛的概览,包括: 横向信息产品、数据整合、技能寻获、智囊门户网站、在线学习、Web服务、多媒体收藏索引、在线采购和设备可共用性。Elsevier的横向信息产品 背景:Elsevier是一家居于领先地位的科技出版商。 问题:可以用纵向信息产品一词来描述:产品分成许多相互分离的门类,每个产品仅涉及其中一个门类的内容。原创 2017-12-11 20:37:39 · 433 阅读 · 0 评论 -
本体建模与语义Web知识发现 8:基于本体的知识推理
以本体作为信息组织形式,通过推理可以获得本体中特定形式的知识集合以及运用本体中的知识来辅助解决涉及语义的应用。 使用OWL本体作为信息检索的载体,用户能够方便地在概念上描述信息需求,构造复杂的语义查询。SPARQL语言查询显示定义的知识,还需要推理引擎,将本体中具有隐含语义关联的数据提取出来,获得所有相关联的数据作为SPARQL查询的数据源。 本体的知识推理从根本上说就是把隐原创 2017-12-31 11:06:39 · 5975 阅读 · 1 评论 -
Neo4j实战
2、图形数据结构建模3、使用Neo4j API 创建节点 创建关系 为节点添加属性 节点类型策略 为关系添加属性 节点标签4、强大的图形遍历 简单遍历:从起始节点开始按照关系使用Neo4j核心Java API查找直接的邻居 使用Neo4j核心Java API进行遍历原创 2017-12-25 14:33:25 · 4506 阅读 · 1 评论 -
Neo4j简介
1、Neo4j在NoSQL领域的地位二、Neo4j具有与ACID兼容的数据格式 原子性(A):可以在一个事务中包含对多个数据库的操作,并确保它们都是在原子性的情况下执行的,如果其中有一个操作发生问题,则整个事务将全部回滚。 一致性(C):当向Neo4j数据库中写数据时,你必须保证随后访问数据库的每个用户读取的都是最近、更新的数据。 隔离性(I):必须确保一原创 2017-12-25 10:57:10 · 531 阅读 · 0 评论 -
自己动手实现主题搜索引擎
1.前言: 软件设计要写大作业了,好慌啊,写什么好呢,室友居然把Everything实验了,那我也写一个与搜索有关的玩玩吧。突然想到大一时候自学过利用whoosh和solr写过简单的搜索引擎,那么今天就自己动手试一试吧。2.简介 本项目主要实现了一个主题搜索引擎。主题搜索引擎是针对某一个领域的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整转载 2017-11-14 10:27:51 · 2061 阅读 · 0 评论 -
项目实战:如何构建知识图谱
摘要: 实践了下怎么建一个简单的知识图谱,两个版本,一个从 0 开始(start from scratch),一个在 CN-DBpedia 基础上补充,把 MySQL,PostgreSQL,Neo4j 数据库都尝试了下。实践了下怎么建一个简单的知识图谱,两个版本,一个从 0 开始(start from scratch),一个在 CN-DBpedia 基础上补充,把 MySQL,Post转载 2017-11-07 22:17:04 · 5567 阅读 · 1 评论 -
搜索引擎和知识图谱那些事 (上).基础篇
这是一篇基础性文章,主要介绍搜索引擎和知识图谱的一些原理、发展经历和应用等知识。希望文章对你有所帮助~如果有错误或不足之处,还请海涵。(参考资料见后)一. 搜索引擎(一).搜索引擎的四个时代 根据张俊林大神的《这就是搜索引擎》这本书中描述(推荐大家阅读),搜索引擎从采取的技术划分为4个时代: 1.史前时代:分类目录的一代转载 2017-11-07 22:33:39 · 764 阅读 · 0 评论 -
图数据库:6 图数据库的内部结构
使用Neo4j图数据库举例说明有几个原因。Neo4j是一个具有原生处理功能和原生图存储的图数据库。它的优点还在于透明度,因为它是开源的,这使富有冒险精神的读者可以很容易深入研究其代码。6.1 原生图处理 假如图数据库存在免索引邻接属性,那么我们说它具有原生处理能力。 使用免索引邻接的数据库引擎中的每个节点都会维护其对相邻节点的引用。因此每个节点都表现为其附近节点的微索引,这比使用全原创 2017-12-20 10:40:29 · 5491 阅读 · 1 评论