论文:C3: Zero-shot Text-to-SQL with ChatGPT
⭐⭐⭐⭐
arXiv:2307.07306,浙大
Code:C3SQL | GitHub
一、论文速读
使用 ChatGPT 来解决 Text2SQL 任务时,few-shots ICL 的 setting 需要输入大量的 tokens,这有点昂贵且可能实际不可行。因此,本文尝试在 zero-shot 的 setting 下来解决 Text2SQL 问题。
本文提出了 C3 来基于 ChatGPT zero-shot 去做 Text2SQL,实现了 1000 tokens per query 下优于 fine-tuning-based methods。
二、C3
C3 由三个关键组件构成:Clear Prompts(CP)、Calibration with Hints(CH)、Consistency Output(CO),分别对应着模型输入、模型偏差和模型输出。
2.1 Clear Prompts 组件
Clear Prompts(CP)组件的目标是为 ChatGPT