知识图谱neo4j—利用python进行知识入库
知识图谱—利用python进行知识入库
作为一个写sql出生的菜鸡,在这里分享一下去年11月到12月之间研究的关于知识图谱的课题相关知识,由于客户的原因最终该项目没有继续进行下去,但是有些经验还是可以跟大家分享一下,理论知识就不说了,很多人已经有类似的分享了,这边分享一个我自己用python写的导入neo4j的脚本,能达到1秒入库4000条左右记录数据,话不多说,直接进入正题
数据准备
为了造假数据也是费尽了脑汁,就以在下比较喜欢的动漫作为主题吧(我可是要成为海贼王的男人~~)
船员信息表
create table kg_role_info (name varchar2(20),age number,birth_address varchar2(200),target varchar2(2000))
name :姓名
age :年龄
birth_address:出生地
target:目标
海贼团成员表
create table kg_hzt_info (hzt_name varchar2(200),member_name varchar2(20),role_name varchar2(20))
hzt_name:海贼团名称
member_name:成员姓名
role_name:角色
插入数据
insert into kg_role_info (NAME, AGE, BIRTH_ADDRESS, TARGET)
values ('蒙奇·D·路飞', 19, '东海-哥亚王国-风车镇', '海贼王');
insert into kg_role_info (NAME, AGE, BIRTH_ADDRESS, TARGET)
values ('罗罗诺亚·索隆', 21, '东海-霜月村', '世界第一的大剑豪');
insert into kg_role_info (NAME, AGE, BIRTH_ADDRESS, TARGET)
values ('娜美', 20, '东海-可可亚西村', '绘制世界地图');
insert into kg_role_info (NAME, AGE, BIRTH_ADDRESS

本文分享了一种使用Python将数据高效导入Neo4j知识图谱的方法,实现了每秒入库约4000条记录的性能。作者以动漫为主题伪造数据,并自写了Oracle数据库操作工具类,详细介绍了数据准备、知识入库过程,以及执行后的效果。文章旨在探讨知识图谱的趣味性和可视化优势,鼓励读者尝试学习和分享。
最低0.47元/天 解锁文章
1758

被折叠的 条评论
为什么被折叠?



