本文是LLM系列文章,针对《Structure Guided Large Language Model for SQL Generation》的翻译。
摘要
生成准确的结构化查询语言(SQL)是一个长期存在的问题,尤其是在将用户的语义查询与结构化数据库进行匹配,然后生成结构化SQL时。现有模型通常将查询和数据库模式输入到LLM中,并依赖LLM执行语义结构匹配和生成结构化SQL。然而,这种解决方案忽略了用户查询和数据库中的结构信息,这些信息可用于增强结构化SQL的生成。这种疏忽可能导致SQL生成不准确或不可执行。为了充分利用该结构,我们提出了一个结构到SQL的框架,该框架利用固有的结构信息来改进LLM的SQL生成。具体来说,我们介绍了我们的结构导向SQL(SGU-SQL)生成模型。SGUSQL首先以结构增强的方式链接用户查询和数据库。然后用语法树分解复杂的链接结构,引导LLM逐步生成SQL。在两个基准数据集上进行的大量实验表明,SGUSQL可以优于16个SQL生成基线。
1 引言
2 相关工作
3 方法
4 实验
5 结论和未来工作
长期以来,生成准确的结构化查询语