
知识图谱
文章平均质量分 58
yayun_kg
这个作者很懒,什么都没留下…
展开
-
Ne4j加载webprotege的owl文件
一.前言webProtégé软件是斯坦福大学医学院生物信息研究中心基于Java语言开发的本体编辑和知识获取软件,或者说是本体开发工具Neo4j是一个高性能的图形数据库,也可以被看作是一个高性能的图引擎webprotege里的本体也能以图的形式表现,希望将webprotege的本体在neo4j里展示二. webprotege导出owl文件参考的某乎相关教程,neo4j的导入命令中的owl文件格式为 ‘RDF/XML’,此处姑且直接导出该类型文件(其他类型文件未测试)下载后解压后放在一个固定的目录原创 2022-04-05 16:42:18 · 1943 阅读 · 1 评论 -
记录一个不同版本数据导出和导入-从本地neo4j-3.5.7版本里面的数据dump后传到服务器上的neo4j-4.3.6版本里面然后load数据
记录一下工作,我从本地电脑上的neo4j-3.5.7版本,dump后,将结果传到服务器上后load到服务器上的neo4j-4.3.6版本里面的记录:打开cmd 后CD进入neo4j-3.5.7的bin目录下面先运行neo4j stop命令关闭neo4j。然后运行命令如下:neo4j-admin dump --database=neo4j --to=data/graph.db.dump其中“data/graph.db.dump”所在的位置就在neo4j-3.5.7的data目录里面。然后我用xft原创 2021-11-23 16:57:22 · 3083 阅读 · 2 评论 -
Neo4j 删除节点、关系,和所有节点
neo4j清空所有数据命令如下:MATCH (n)OPTIONAL MATCH (n)-[r]-()DELETE n,r删除一个节点 DELETE如下一个节点,删除这个节点可以有两种方法,通过 id 属性,或者 name 属性。1.1 通过 name 属性 删除这一个节点,如下所示:MATCH (n:TEST1{name:'temp'})delete n1.2 通过 id 属性 删除这一个节点,如下所示:MATCH (r)WHERE id(r) = 492DELETE原创 2021-10-27 15:33:15 · 37012 阅读 · 2 评论 -
在neo4j中如何将并行一度关系查询性能提升
在海量的neo4j的图数据库中,如何进行并行一度关系查询性能提升。可以通过巧妙的使用Cypher并搭配存储过程,可以实现很多实用的查询。一、查询需求[A=[A1,A2,A3,…,An],B=[B1,B2,B3,…,Bm],A和B是两个节点集合。需要查询A中的每个元素分别和B中每个元素是否有一度关系,并返回有关系的实体对。这个查询实现了寻找A中的每个元素分别和B中每个元素是否有一度关系的需求,实现了基本的功能。查询执行时是顺序执行,无法并行。在查询的上半段定义了集合a和b,使用笛卡儿积的方式组合两个列原创 2021-10-14 10:20:54 · 1032 阅读 · 0 评论 -
py2neo—Neo4j&python的配合使用
今天就通过python面向Neo4j的库py2neo来对Neo4j进行一些简单的操作,包括:连接Neo4j数据库节点的建立节点之间关系的建立关系属性赋值以及属性值的更新通过属性值查找节点/关系通过节点/关系查找相关联的节点/关系结合目前的一个项目来说说一些坑和注意点1 连接Neo4j数据库要通过python来操作Neo4j,首先需要安装py2neo,可以直接使用pip安装。pi...原创 2020-04-13 17:58:06 · 1343 阅读 · 1 评论 -
知识图谱数据库neo4j-import 数据导入总结
最近我在尝试存储知识图谱的过程中,对Neo4j图数据库有了一个新的认知,这里我摘取了一段Neo4j的简介:Neo4j是一个高性能的,NOSQL图形数据库,它将结构化数据存储在网络上而不是表中。它是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎,但是它将结构化数据存储在网络(从数学角度叫做图)上而不是表中。Neo4j也可以被看作是一个高性能的图引擎,该引擎具有成熟数据库的所有特性...原创 2020-04-13 17:41:27 · 2132 阅读 · 0 评论 -
大数据提取数据深度学习三元组关系抽取大规模知识图谱数据流设
从大数据里面提取数据,进入深度学习框架,提取关系三元组。做大规模知识图谱数据流设计如下图:比较详细讲述g’yu原创 2020-04-01 15:36:31 · 1555 阅读 · 0 评论 -
知识图谱学习(笔记整理)
本篇来自于文章《从技术实现到产品落地,“知识图谱”的未来还有多远?》知识图谱学习(一)一、组成部分知识图谱大致可分为:知识建模、知识获取、知识融合、 知识存储、知识应用等。二、知识图谱的架构共分为两种:逻辑架构和技术架构-逻辑架构数据层:是逻辑架构的底层,用来存储真实的节点数据与关系数据。模式层:模式层在数据层之上,存储提炼过的数据,通过本体库来管理数据关系。本体位于模式层,描...转载 2020-03-07 20:38:02 · 7582 阅读 · 0 评论 -
知识图谱多数据源融合
知识图谱的实体往往面临数据融合的问题,因为知识图谱的数据源可能有多个,在不同数据源有对同一实体的不同表达,即使在同一个数据源里也可能存在这种情况,需要通过一定手段将其合并。 知识图谱的数据融合过程通常如下:1,数据预处理:输入的原始数据源往往存在脏数据和格式不一致数据,需要进行人工进行规整,这一步过程是实际工程中比较费时但是作用很大的工作,没有好的数据处理后续的算法效果往往也不会好。2...转载 2020-02-06 11:39:26 · 1427 阅读 · 0 评论 -
大规模知识图谱的存储
(1)存储系统架构目前大规模的知识图谱一般采用图数据库做为最基本的存储引擎。图数据库的优点在于其天然的能表示知识图谱结构,图中的节点表示知识图谱的对象,图中的边表示知识图谱的对象关系;但是其缺点是图数据库的更新比较复杂,对于复杂查询的支持不够。所以要使用以图数据库为主,结合其他系统的方式来存储知识图谱。由于图谱每天数据都会有变化,使用hadoop这种适合批量离线处理的系统做为离线更新系统,为了...转载 2020-02-06 11:35:29 · 1527 阅读 · 0 评论 -
知识图谱的模式层和数据层设计
知识图谱分为模式层和数据层两部分:其中模式层是是知识图谱的核心,在模式层存储的是经过提炼的知识;数据层存储的是具体数据信息。图谱模式层和数据层定义如下:(一)模式层:模式层使用mysql数据库来存储,设计方式如下:1,类层次结构:有些知识图谱采用的是树状的类结构,每个子类继承其祖先节点的属性。图谱采用的是简单的两层类层次结构,object_object类是根节点,其他所有类是其子节点。2...转载 2020-02-06 10:40:13 · 7481 阅读 · 0 评论 -
大规模知识图谱数据流设计
知识图谱的数据量,更新方式,使用场景的不同,决定其数据流如何设计。在应用有着上亿级别的节点数,数据存在着离线批量更新以及用户实时手工修改两种方式,使用场景也有着图查询以及模糊的搜索查询。这样就决定着数据流设计如下图:分别介绍其中的功能模块:(1)图数据库采用图数据库来存储知识图谱的数据,图数据库天然地满足节点–>关系–>节点这种存储格式。目前业界多使用neo4j,titan等...转载 2020-02-06 10:36:04 · 1770 阅读 · 0 评论 -
关于如何自动化构建知识图谱的想法
知识图谱数据写入与构建在这里 如何自动化构建知识图谱本人提供一个基本思路:a,将需要抽取的数据从库里面读出、关系的提取模型、三元组数据的写入的代码全部整合封装成一个类函数(class NEO4J)。b,然后只要输入一个位置数字即从xx位置开始读取数据,数据读取后自动进入关系提取模型得到三元组,将得到的三元组自动同时写入mongodb和neo4j中,存入mongodb是为了备份。c,至于代码...原创 2020-01-13 11:42:42 · 1402 阅读 · 0 评论