知识图谱构建

最新推荐文章于 2025-04-05 17:33:17 发布

Kalika0-0

最新推荐文章于 2025-04-05 17:33:17 发布

阅读量1.2k

点赞数 16

分类专栏：小白摆烂操作文章标签： pytorch 学习

本文链接：https://blog.youkuaiyun.com/m0_56065966/article/details/143277362

版权

小白摆烂操作专栏收录该内容

43 篇文章

订阅专栏

1.导入Python库和模块用于处理CSV文件并与Neo4j图数据库交互

import csv
import py2neo
from py2neo import Graph,Node,Relationship,NodeMatcher

（1）import csv：导入 csv`模块，用于读取和写入CSV文件

（2）import py2neo：导入py2neo库，提供与Neo4j图数据库进行交互的接口

（3）Graph：用于连接和操作Neo4j图数据库的主要类

（4）Node：代表图数据库中的节点，节点是Neo4j中存储数据的基本单元。

（5）Relationship：表示图数据库中的关系，用于连接两个节点

（6）NodeMatcher：用于在图中查找特定节点

2.连接本地Neo4j图数据库实例，创建Graph对象用于数据库操作

graph = Graph("bolt://localhost:7687", auth=("neo4j", "12345678"))

（1）bolt://： Neo4j的Bolt协议，用于高效传输数据

（2）localhost ：表示数据库运行在本地（即同一台机器上）

（3）7687 是Neo4j的默认Bolt端口，通常Neo4j会在这个端口上监听Bolt连接

（4）auth 参数用于设置数据库的用户名和密码。

3.读取CSV文件并逐行输出内容

with open('D:/bert/HLM.csv','r',encoding='utf-8')as f:
    reader=csv.reader(f)
    for item in reader:
        if reader.line_num==1:
            continue
        print("当前行数",reader.line_num,"当前内容:",item)

（1）with open()语句打开指定路径的CSV文件HLM.csv

（2）文件以只读模式（'r'）打开，编码格式为UTF-8

（3）使用with语句可以确保在文件操作完成后，文件会自动关闭

（4）通过csv.reader()函数创建一个CSV读取器reader，用于逐行读取文件内容

（5）使用for循环遍历CSV文件中的每一行，将当前行的内容存储在变量item中

（6）reader.line_num获取当前读取行号。如果行号是1（第一行），则使用continue跳过这行。这通常用于跳过CSV文件的表头

4.读取CSV文件，包含人物之间的关系信息。每一对人物作为节点，彼此之间的关系作为边，并将这些信息存储到图数据库中

with open('D:/bert/HLM.csv','r',encoding='utf-8')as f:
    reader=csv.reader(f)
    for item in reader:
        if reader.line_num==1:
            continue
        print("当前行数",reader.line_num,"当前内容:",item)
        start_node=Node("Person",name=item[0])
        end_node=Node("Person",name=item[1])
        relation=Relationship(start_node,item[3],end_node)
        graph.merge(start_node,"Person","name")
        graph.merge(end_node,"Person","name")
        graph.merge(relation,"Person","name")