技术背景介绍
Apache AGE是一款为PostgreSQL提供图数据库功能的扩展。AGE代表"A Graph Extension",源自于Bitnine在PostgreSQL 10基础上开发的AgensGraph,一个多模型数据库。其目标是创造一种能够同时处理关系型模型和图模型数据的单一存储,这样用户可以使用标准的ANSI SQL以及开放的图查询语言openCypher。Apache AGE的数据元素包括节点(nodes)、连接节点的关系(edges)以及节点和关系的属性。
这篇文章将展示如何利用大语言模型(LLMs)为可以通过Cypher语言查询的图数据库提供自然语言接口。
核心原理解析
Cypher是一种声明式图查询语言,支持在属性图中进行表达性强且高效的数据查询。通过LLM,我们可以将自然语言问题转换为Cypher查询,简化用户与图数据库的交互。
代码实现演示
设置PostgreSQL与AGE
首先,需要安装运行包含AGE扩展的PostgreSQL实例。可以使用官方提供的AGE Docker镜像快速启动一个本地Docker容器:
docker run \
--name age \
-p 5432:5432 \
-e POSTGRES_USER=postgresUser \
-e POSTGRES_PASSWORD=postgresPW \
-e POSTGRES_DB=postgresDB \
-d \
apache/age
Python接口配置
安装必要的库,如langchain
和langchain_openai
,并使用以下代码连接数据库:
from langchain.chains import GraphCypherQAChain
from langchain_community.graphs.age_graph import AGEGraph
from langchain_openai import ChatOpenAI
conf = {
"database": "postgresDB",
"user": "postgresUser",
"password": "postgresPW",
"host": "localhost",
"port": 5432,
}
graph = AGEGraph(graph_name="age_test", conf=conf)
数据库初始化与查询示例
首先,向数据库插入数据:
graph.query(
"""
MERGE (m:Movie {name:"Top Gun"})
WITH m
UNWIND ["Tom Cruise", "Val Kilmer", "Anthony Edwards", "Meg Ryan"] AS actor
MERGE (a:Actor {name:actor})
MERGE (a)-[:ACTED_IN]->(m)
"""
)
然后,我们可以使用LLM生成Cypher查询并获取答案:
chain = GraphCypherQAChain.from_llm(
ChatOpenAI(temperature=0), graph=graph, verbose=True
)
result = chain.invoke("Who played in Top Gun?")
print(result['result'])
高级用法
- 限制查询结果数量:
chain = GraphCypherQAChain.from_llm(
ChatOpenAI(temperature=0), graph=graph, verbose=True, top_k=2
)
- 返回中间查询步骤:
result = chain.invoke("Who played in Top Gun?", return_intermediate_steps=True)
print(result['intermediate_steps'])
应用场景分析
这种结合LLM与图数据库的查询方式可以极大地简化复杂数据集的交互过程,无需用户具备Cypher语言的专业知识。例如,电影数据库查询、电商社交推荐系统等场景中都可以应用。
实践建议
- 确保数据库架构信息更新后及时刷新以保持查询的准确性。
- 根据应用需求调整LLM的生成逻辑以优化响应速度和质量。
如果遇到问题欢迎在评论区交流。
—END—