本文是LLM系列文章,针对《UrbanKGent: A Unified Large Language Model Agent Framework
for Urban Knowledge Graph Construction》的翻译。
UrbanKGent:一种用于城市知识图谱构建的统一的大型语言模型Agent框架
摘要
城市知识图谱最近作为一个新兴的构建块,从多源城市数据中提取关键知识,用于不同的城市应用场景。尽管城市知识图谱构建(UrbanKGC)有着良好的效益,但它仍然严重依赖人工,阻碍了其潜在的发展。本文提出了一个统一的大型语言模型代理框架UrbanKGent,用于城市知识图谱的构建。具体而言,我们首先通过异构感知和地理空间融合的指令生成,为UrbanKGC任务(如关系三元组提取和知识图谱填充)构建知识渊博的指令集。此外,我们提出了一个工具增强迭代轨迹细化模块来增强和细化从GPT-4中提取的轨迹。通过在Llama-2-13B上进行具有增广轨迹的混合指令微调,我们获得了UrbanKGC代理UrbanKGent-13B。我们使用人类和GPT-4自我评估对两个真实世界的数据集进行了全面评估。实验结果表明,UrbanKGent-13B不仅在UrbanKGC任务中显著优于21个基线,而且以大约20倍的成本超过了最先进的LLM GPT-4,超过了10%以上。我们部署UrbanKGent-13B来提供在线服务,与现有的基准相比,仅使用五分之一的数据,就可以构建一个关系丰