Graphiti快速入门指南：基于知识图谱的智能搜索系统实践

牧宁李

于 2025-06-04 09:09:41 发布

阅读量386

点赞数 4

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/gitblog_00211/article/details/148416873

Graphiti快速入门指南：基于知识图谱的智能搜索系统实践

graphiti 用于构建和查询时序感知知识图谱的框架，专为在动态环境中运行的 AI 代理量身定制。项目地址: https://gitcode.com/gh_mirrors/grap/graphiti

项目概述

Graphiti是一个基于Neo4j图数据库构建的知识图谱智能搜索系统，它结合了语义搜索与传统关键词检索的优势，能够从非结构化文本中自动提取知识并构建丰富的关联网络。本文将带您快速上手Graphiti的核心功能，通过一个完整的示例演示如何构建知识图谱并实现智能搜索。

技术原理

Graphiti的核心技术栈包含三个关键组件：

知识提取引擎：利用自然语言处理技术从文本中自动识别实体、关系及属性
混合搜索系统：融合BM25关键词检索与向量相似度计算的混合搜索算法
图感知重排序：基于搜索结果在图结构中的拓扑关系优化排序结果

这种架构使得系统既能理解查询的语义含义，又能利用图结构的关联特性提供更精准的搜索结果。

环境准备

基础环境要求

运行中的Neo4j图数据库实例（推荐使用Neo4j Desktop）
Python 3.9及以上版本
OpenAI API密钥（用于嵌入向量生成）

安装步骤

安装核心库：

pip install graphiti-core

配置环境变量：

# 必须配置的OpenAI密钥
export OPENAI_API_KEY=你的API密钥

# Neo4j连接参数（如使用默认值可省略）
export NEO4J_URI=bolt://localhost:7687
export NEO4J_USER=neo4j
export NEO4J_PASSWORD=password

核心功能演示

1. 知识图谱初始化

系统会自动在Neo4j中创建必要的索引和约束条件，包括：

全文检索索引
向量索引
节点唯一性约束
关系类型约束

这些底层优化确保了后续操作的高效执行。

2. 内容导入与知识提取

通过添加"episode"（文本片段），系统会自动执行以下处理流程：

实体识别与消歧
关系抽取
属性提取
时间信息解析
向量嵌入生成

# 示例代码片段
episode = {
    "text": "某知名企业家在1999年创立了阿里巴巴集团...",
    "timestamp": "1999-01-01"
}

3. 混合搜索实践

Graphiti提供两种主要搜索模式：

边搜索（Edge Search）

查找实体间的关系，返回结果包含：

关系事实描述
源节点和目标节点
有效时间范围
置信度评分

节点搜索（Node Search）

使用预定义搜索策略直接查找实体节点，支持：

混合检索（RRF算法融合）
纯语义搜索
关键词检索

4. 图感知重排序

基于首次搜索结果，系统可以：

提取top结果的源节点
计算图中其他节点与该节点的距离
结合原始相关性分数和拓扑距离重新排序

这种机制显著提升了搜索结果的相关性。

结果解析指南

边搜索结果结构

{
    "uuid": "关系唯一标识",
    "fact": "某知名企业家创立了阿里巴巴",
    "valid_at": "1999-01-01",
    "source_node": "某知名企业家节点ID",
    "target_node": "阿里巴巴节点ID"
}

节点搜索结果结构

{
    "uuid": "节点唯一标识",
    "name": "某知名企业家",
    "labels": ["Person","Entrepreneur"],
    "attributes": {
        "出生地": "浙江杭州",
        "职位": "前公司负责人"
    }
}