
文章主要内容与创新点总结
一、主要内容
- 研究背景:大语言模型(LLMs)在文本到SQL(Text-to-SQL)任务中效果显著,但跨系统SQL翻译(SQL-to-SQL)这一具有重要实际意义的任务仍未得到充分探索。现有SQL基准测试存在局限性,仅聚焦少数数据库系统(多为SQLite),且无法覆盖大量系统特定的SQL方言(如自定义函数、数据类型、语法规则等),难以满足跨系统SQL翻译的评估需求。
- PARROT基准测试介绍:提出PARROT(Practical And Realistic BenchmaRk for CrOss-System SQL Translation),这是首个专门用于跨系统SQL翻译评估的大规模数据集与评估套件,涵盖22个生产级数据库系统。包含三个核心变体:
- 主数据集:598个经人工验证的翻译对,源自38个公开基准测试和真实业务场景;
- PARROT-Diverse:28,003个翻译样本,用于广泛的语法测试;
- PARROT-Simple:5,306个代表性样本,用于针对性压力测试。
- 构建方法:通过开源领域(38个基准测试、代码仓库测试用例)和私有领域(字节跳动ByteHouse业务场景

订阅专栏 解锁全文
2万+

被折叠的 条评论
为什么被折叠?



