如何让 AI 生成准确的 SQL

最新推荐文章于 2025-10-28 19:40:51 发布

原创

最新推荐文章于 2025-10-28 19:40:51 发布 · 1.4k 阅读

8 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #sql #数据库

让您像聊天一样，用一句话查询公司数据，轻松生成图表，快速获得商业洞察。

很多用户反馈，都说比预想中的好，也好奇我们是怎么做到的

借这个机会，再来讲一下

我们是基于 SQL 的问数 AI

因此要想问数效果好，SQL 是关键

而为了生成准确的 SQL，除了选用靠谱的大模型，

如何驾驭这些大/小模型，也至关重要。

就好比做菜，要想味道好，食材重要，厨师更重要。

而我们是如何做的呢？

在 AskTable 内部，生成 SQL 的系统可划分为三大核心模块：Meta Brain、Meta Retrieval 和 Data Retrieval，如下图。

（https://docs.asktable.com/docs/chat-database/database-query-via-natural-language）

情报中心——Meta Brain：构建元

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

察言观数AskTable

关注关注

6
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

基于AI大模型实现自然语言转SQL、SQL解释、SQL优化和SQL转换

AI天才研究院

06-28

1818

随着大数据和人工智能技术的发展，数据分析和数据挖掘在各行各业中的应用越来越广泛。SQL（Structured Query Language）作为关系数据库的查询语言，是数据分析的重要工具。然而，SQL语言的复杂性和专业性使得许多非技术背景的用户难以直接使用，阻碍了数据的广泛利用。为了降低SQL的使用门槛，许多研究者和企业开始探索如何通过自然语言处理（NLP）技术，将自然语言转化为SQL查询语句，从而让用户可以通过自然语言与数据库进行交互。

AI SQL 准确性：测试不同的 LLMs + 上下文策略以最大化 SQL 生成准确性

AI天才研究院

05-11

285

现在，我们已经设置了实验，我们需要确定哪些杠杆会影响准确性，以及我们的测试集是什么。在这里，我们向 LLM 提供了针对该问题的 10 个最相关的 SQL 查询示例（从存储的 30 个示例列表中），准确率飙升。我们最终对上下文的处理方法是一种更复杂的机器学习方法——将先前的查询和表模式的嵌入加载到向量数据库中，并且仅选择与所问问题最相关的查询/表。，它可以生成 SQL 代码以供您的数据库使用，以及额外的功能，如能够生成用于图表的 Plotly 代码、后续问题以及各种其他功能。结果，用一句话说，很糟糕。

参与评论您还未登录，请先登录后发表或查看评论

五、【AI】Dify自然语言生成Sql并查询数据库

qq_43127792的博客

03-28

9262

1、把表结构（含表名、字段、主外键关系）导入到知识库，用知识库来检索生成可执行Sql语句，执行Sql语句，生成数据结果。3、第三个节点选择添加节点->模板转换，输入的变量就是第二个节点输出的**/Json**2、第二个节点选择添加节点->工具->rookie_text2data，输入的变量就“5、第五个节点选择添加节点->工具->rookie_excute_sql，输入的变量“4、第四个节点选择添加节点->LLM（大语言模型），并提供System信息指导。8、第七个节点选择添加节点->结束，输入的变量“

用快马AI一键生成SQL：告别手写数据库查询的烦恼

最新发布

OnyxPanther23的博客

10-28

731

最近在开发一个需要频繁与数据库交互的项目，每次手写SQL语句都让我感到有些繁琐。特别是当查询条件变得复杂时，不仅要考虑语法正确性，还得反复调试。用HTML+CSS构建基础页面，包含一个文本输入框用于接收自然语言描述，一个显示生成的SQL语句的输出区域。借助平台内置的AI模型（如Kimi-K2），将用户输入的自然语言转换为规范的SQL语法。这一步需要特别处理模糊描述，比如“最近一个月”需要明确为具体的日期范围。历史记录功能保存最近生成的SQL，方便反复调整修改。实现一键部署的完整过程。

让AI帮你写SQL？揭秘“提及抽取+链接”新范式，文本到SQL的终极秘籍！

许泽宇的技术分享

07-08

821

文章摘要：Text-to-SQL技术新范式"提及抽取+链接"将自然语言问题转化为SQL查询，相比传统"拼装式"方法，该方案通过BERT+CRF模型直接从文本中抽取SQL元素并链接到数据库表头，实现87.8%的逻辑准确率。其一体化架构简化了模块关系建模，但处理嵌套结构仍有不足。该技术让非技术人员也能轻松查询数据库，是AI与结构化数据交互的重要突破，未来有望拓展至多表复杂查询场景。

AI数据分析：deepseek生成SQL

atbigapp的博客

03-03

3596

在当今数据驱动的时代，数据分析已成为企业和个人决策的重要工具。随着人工智能技术的快速发展，AI 驱动的数据分析工具正在改变我们处理和分析数据的方式。本文将着重介绍如何使用 DeepSeek 进行自动补全SQL 查询语句。我们都知道，SQL 查询语句是每个数据分析师的必修课，今天就教大家如果使用DeepSeek自动补全SQL.以下是一个使用 DeepSeek 自动补全SQL 的实际案例。

AI自动生成SQL语句的开源代码 sqlcoder-main.zip

02-09

开源的AI自动生成SQL语句源代码，这款SQLCoder-70B-Alpha在文本到SQL的转换能力上超越了包括GPT-4在内的所有通用模型，它能更准确地理解你的需求，并生成相应的SQL查询。SQLCoder2和SQLCoder-7B模型已经向公众开放，大家可以直接拿来嵌入到你的业务开发应用中。大家到这个地址来下载模型：https://huggingface.co/defog/sqlcoder-7b-2，即可使用。

深度使用国产Bg-Tinkle数据库客户端—太赞了，居然还集成chatGPT AI生成SQL

02-14

3538

Bg-Tinkle是国产开源软件，功能和Navicat、DataGrip等客户端软件类似，它可以帮助用户快速地连接数据库、查找数据等操作，还直观的为用户提供方便快捷的数据管理可视化界面帮助用户提供对于数据的管理效率。除此之外还提供了一键填充表数据、一键数据可视化为饼图、矩阵图、树图、桑基图等图表、AI生成SQL、SQL练测生成、逻辑ER图、SQL逆生成代码等诸多创新功能，现把使用的教程分享给大家，希望大家喜欢并支持~

基于 Deepseek 模型生成 SQL 查询语句的 Python 源码

02-11

需要注意的是，虽然Deepseek模型在处理SQL查询语句生成方面表现出了强大的能力，但它仍然是一种人工智能模型，无法完全替代人类的专业知识和经验。在使用Deepseek模型生成的SQL查询语句时，我们还需要进行详细的检查...

Dify自然语言生成Sql并查询数据库

07-14

5. AI技术的应用：Dify作为一个AI工具，集成了多种人工智能技术，包括机器学习、模式识别、数据挖掘等，使得自然语言与数据库的交互变得更加智能化和人性化。 6. 用户友好性：通过简化复杂的技术步骤，Dify允许非...

用AI来写SQL：让ChatGPT成为你的数据库助手

王傲旗的大数据之路

11-13

2024

AI写SQL不是要完全替代人工，而是要成为我们的得力助手。节省编写SQL的时间减少出错概率学习SQL最佳实践最重要的是，这让我们能够将更多精力放在业务逻辑和数据分析上，而不是陷入SQL语法的细节中。🎁福利：后台回复"SQL模板"，获取本文提到的详细SQL提示词模板。#技术进阶 #效率工具 #数据库开发。

SQL:用AI软件来完成sql的触发器的使用

s1316339343的博客

05-21

1099

说明：本章主要使用baidu comate 的AI软件来完成。

Vanna-AI：让你的大模型说好SQL

m0_65555479的博客

05-30

2695

可能大家都想学习AI大模型技术，也想通过这项技能真正达到升职加薪，就业或是副业的目的，但是不知道该如何开始学习，因为网上的资料太多太杂乱了，如果不能系统的学习就相当于是白学。很明显，最大的区别不在于大模型的类型，而在于为大模型提供的上下文的类型（例如使用的训练数据）。• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力：大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

Vanna-AI实现自然语言转SQL

xuweilin的博客

07-24

1305

告别代码，用自然语言轻松查询数据库，领先的RAG2SQL技术让结果更智能、更精准。

告别 SQL 手写时代！AI SQL助手来了，输入“人话“直接操作数据库，效率翻倍

十二测试录

07-28

939

摘要：AISQL助手是一款智能SQL生成工具，可将自然语言需求自动转换为精准SQL语句并执行。它能自动理解数据库表结构、智能优化查询性能、自动构造测试数据，并支持安全私有化部署。该工具适用于创建表结构、生成测试数据、执行复杂查询等场景，帮助业务人员、产品经理等非技术人员轻松操作数据库，大幅提升数据获取和分析效率。

【干货】2小时用AI完成的SQL教程也太赞了吧，不推荐deepseek

CDA数据分析师

02-19

1460

通过理解数据库和表的概念以及SQL语言的基本结构，你可以开始构建简单的查询语句来检索和操作数据。这是学习SQL的基础，后续我们将在此基础上深入学习更复杂的查询和操作。通过上述示例，你可以看到如何使用 WITH 子句创建一个临时表，并在此基础上进行各种数据检索操作。这些示例涵盖了 SELECT、WHERE、ORDER BY 和 LIMIT 的基本用法，帮助你更好地理解和验证查询结果。使用SELECT语句从单个表中检索数据使用WHERE子句过滤数据使用ORDER BY排序结果集。

滴滴经验分享：SQLFlow如何让运营专家用上AI？

阿里云云栖号

11-01

1530

蚂蚁金服过去十五年，重塑支付改变生活，为全球超过十二亿人提供服务，这些背后离不开技术的支撑。在2019杭州云栖大会上，蚂蚁金服将十五年来的技术沉淀，以及面向未来的金融技术创新和参会者分享。我们将其中的优秀演讲整理成文并将陆续发布在“蚂蚁金服科技”公众号上，本文为其中一篇。自从今年4月份开源以来，SQLFlow受到了业界和社区的广泛关注。SQLFlow项目以社区主导，与外部开发者进行合作...

如何评估AI生成SQL的准确性？

04-10

<think>好的，我现在要处理用户关于评估AI生成SQL准确性的方法和标准的问题。首先，我需要仔细阅读用户提供的参考资料，找出相关的信息点。用户引用了四个来源，其中引用[1]提到了使用LLM作为评判标准来评估SQL生成的有效性，引用[2]讨论了优化方法，如基于Schema生成和语法校验，引用[3]提到RSL-SQL框架在准确率上的提升，引用[4]则是一个实战案例。用户的问题集中在评估方法上，所以需要从这些引用中提取相关内容。首先，引用[1]提到使用LLM自身作为评判标准，这可能涉及让另一个AI模型来检查生成的SQL是否符合预期。然后引用[2]中的优化方法如语法校验和示例驱动微调，这些也可以作为评估的标准，比如检查语法正确性。引用[3]中的执行准确率和与其他方法的比较，说明执行结果与实际数据库的匹配程度是一个重要指标。引用[4]的实战案例可能涉及实际应用中的测试方法，比如人工校验和单元测试。接下来，我需要将这些信息组织成结构清晰的回答。可能分为几个部分：语法正确性、语义准确性、执行结果验证、人工校验、自动化测试框架、LLM自评估和成本效率。每个部分都需要结合引用内容，例如语法校验来自引用[2]，执行准确率来自引用[3]，LLM自评估来自引用[1]。同时，用户要求生成相关问题，我需要根据回答内容提出相关的问题，例如如何结合自动化和人工评估，或者如何量化语义准确性。这些问题需要与评估方法和标准相关，确保用户能进一步深入了解。最后，要确保回答符合格式要求，使用正确的中文表达，行内公式用$...$，独立公式用$$...$$，但当前问题可能不涉及数学公式，所以可能不需要使用。但需要检查是否有需要公式的地方，比如可能提到的准确率计算，如果有的话需要用正确格式。总结一下，回答的结构应该是先概述方法和标准，再分点详细说明，每个点结合引用内容，最后生成相关问题。需要确保引用标识正确，如[^1]、[^2]等，并自然地放置在相关段落末尾。</think>### 评估AI生成SQL准确性的方法与标准评估AI生成SQL的准确性需要从**语法正确性**、**语义合理性**和**执行结果匹配度**三个维度进行综合验证，并结合自动化工具与人工校验。以下是具体方法： #### 1. **语法正确性校验** - **静态语法分析**：使用工具（如`sqlparse`或数据库自带的语法检查器）验证生成的SQL是否符合标准语法规范。例如，检查括号匹配、关键字使用等[^2]。 - **动态预执行验证**：通过数据库的`EXPLAIN`命令模拟执行，检测是否存在语法错误或潜在性能问题（如索引缺失）。 #### 2. **语义合理性评估** - **Schema一致性**：确保生成的SQL字段名、表名与数据库实际结构一致。例如，若数据库中存在`Employee(id, name)`表，生成的`SELECT name FROM Employee`需严格匹配字段和表名[^4]。 - **逻辑完整性**：验证查询逻辑是否覆盖用户意图。例如，用户要求“统计2023年销售部工资”，生成的SQL需包含时间过滤（`date BETWEEN '2023-01-01' AND '2023-12-31'`）和部门关联（`JOIN Department ON department_id`）[^4]。 #### 3. **执行结果匹配度** - **执行准确率**：在测试集上运行生成的SQL，对比其返回结果与预期答案的一致性。例如，在基准数据集BIRD上，RSL-SQL框架通过执行准确率（67.21%）验证其有效性[^3]。 - **错误日志分析**：通过正则表达式或AI模型解析数据库返回的错误信息（如`Unknown column`），定位并修正SQL中的语义错误[^2]。 #### 4. **人工校验与场景覆盖** - **人工抽样检查**：对复杂查询（如多表连接、嵌套子查询）进行人工复核，确保逻辑正确性。 - **边界案例测试**：覆盖空值处理（`NULL`）、极端条件（如`WHERE amount > 1e6`）等场景，验证模型的鲁棒性。 #### 5. **自动化测试框架** - **单元测试集成**：构建包含输入-输出对的测试用例库，自动化验证模型生成的SQL。例如，输入“查询销售部员工数量”，预期SQL应为： ```sql SELECT COUNT(*) FROM Employee WHERE department_id = (SELECT id FROM Department WHERE name = '销售部') ``` 通过自动化比对实际输出与预期结果，计算准确率[^3][^4]。 #### 6. **LLM自评估与成本控制** - **模型自评判**：利用LLM（如GPT-4o）对生成的SQL进行自我评分，通过Prompt设计（如“请判断以下SQL是否满足需求：[用户问题] + [生成SQL]”）实现低成本初步筛选[^1][^3]。 - **成本效率优化**：对比不同模型的生成质量与资源消耗。例如，RSL-SQL框架通过减少冗余 token 使用，在保证准确率的同时降低计算成本[^3]。 --- ### 相关问题