基于图的个性化检索增强生成框架(PGraphRAG)在大语言模型中的应用研究

一、研究背景与意义

随着大型语言模型(LLMs)的快速发展，个性化和上下文感知响应能力已成为改善用户体验的关键因素。然而，现有的个性化方法主要依赖用户历史记录来增强提示，这种方法在冷启动场景下效果受限。特别是当用户数据稀疏或不可用时，难以生成有效的个性化输出。本研究提出了一个创新的框架 PGraphRAG (Personalized Graph-based Retrieval-Augmented Generation)，通过利用以用户为中心的知识图谱来增强个性化能力。

二、技术创新

1. PGraphRAG框架设计

PGraphRAG框架的核心创新在于:

用户中心的知识图谱构建

构建二分图 G=(U,V,E)，其中U表示用户节点，V表示项目节点，E表示交互边
用户配置文件Pi定义为用户i的历史评论集合和相关项目的其他用户评论

检索增强机制

查询函数(φq)：将输入转换为检索查询
基于图的检索®：利用二分图检索最相关的k个条目
提示构造(φp)：组合输入与检索结果生成个性化提示

在这里插入图片描述

2. 个性化基准测试集

研究团队开发了一个全面的基准测试集，包含12个个性化任务：

长文本生成任务(4个)
短文本生成任务(4个)
序数分类任务(4个)

每个任务都经过精心设计，确保能够评估模型在真实场景中的性能。

三、实验设计与结果分析

1. 实验设置

模型：LLaMA-3.1-8B-Instruct和GPT-4o-mini
评估指标：ROUGE-1、ROUGE-L、METEOR(文本生成)，MAE和RMSE(评分预测)
检索方法：BM25和Contriever
实验环境：NVIDIA A100 GPU (80GB)

2. 性能评估

在各项任务中，PGraphRAG相比基线方法都取得了显著提升：

1. 长文本生成：

ROUGE-1: +32.1%
ROUGE-L: +21.7%
METEOR: +25.7%
酒店体验生成任务中，相比LaMP基线提升：

2. 短文本生成：

ROUGE-1: +5.6%
ROUGE-L: +5.9%
METEOR: +6.8%
用户产品评论标题生成任务中提升：

3. 消融实验结果：

邻居信息的重要性：仅使用邻居信息的效果接近或超过完整模型
检索数量k的影响：k=4通常能获得最佳性能
检索方法比较：BM25和Contriever性能相近，BM25略占优势

四、技术实现细节

1. 图构建与检索流程

class PGraphRAG:
    def __init__(self):
        self.graph = BipartiteGraph()  # 二分图结构
        self.retriever = BM25Retriever()  # 检索器
        
    def build_user_profile(self, user_id):
        # 构建用户配置文件
        direct_edges = self.graph.get_user_edges(user_id)
        neighbor_edges = self.graph.get_neighbor_edges(user_id)
        return direct_edges.union(neighbor_edges)
        
    def retrieve(self, query, k=4):
        # 检索相关内容
        user_profile = self.build_user_profile(query.user_id)
        return self.retriever.get_top_k(query, user_profile, k)

2. 提示构造

def construct_prompt(self, input_text, retrieved_contexts):
    prompt = f"""基于以下上下文生成个性化响应：
    
    用户历史：
    {retrieved_contexts}
    
    当前输入：
    {input_text}
    """
    return prompt