ChatSQL 使用教程
【免费下载链接】ChatSQL 项目地址: https://gitcode.com/gh_mirrors/ch/ChatSQL
项目介绍
ChatSQL 是一个开源项目,旨在通过自然语言处理技术将自然语言转换为 SQL 查询语句,并直接连接数据库进行查询。该项目支持多表联查、复杂查询以及自定义数据库 schema 等功能。ChatSQL 基于 ChatGLM-6B 和 MOSS 大模型,提供了强大的语言模型能力。
项目快速启动
环境准备
首先,确保你已经安装了 Conda 环境管理工具。然后,按照以下步骤进行环境设置和项目启动:
# 创建并激活 Conda 环境
conda create -n chatsql python=3.9
conda activate chatsql
# 安装项目依赖
pip install -r requirements.txt
# 新建文件夹
mkdir DB
mkdir logs
# 生成本地数据库并插入数据
python local_database.py
# 启动项目
# 基于 GLM 生成 SQL
python main_gui.py
# 或者基于 MOSS 生成 SQL
python main_gui_moss.py
配置文件
项目启动前,需要配置 info.json 文件,详细描述数据库信息,以便 ChatGPT 理解数据库结构。
{
"database": {
"name": "your_database_name",
"tables": {
"table1": {
"columns": ["column1", "column2"]
},
"table2": {
"columns": ["column1", "column2"]
}
}
}
}
应用案例和最佳实践
单表查询
假设你需要查询 2019 年净收益率大于 10 的货物名称,可以使用以下自然语言查询:
请帮我查询在2019年的货物销售的净收益率大于10的货物名称
多表联查
如果你需要查询 2019 年净收益率大于 10 且销售量大于 100 的销售负责人名字,可以使用以下自然语言查询:
请帮我查询在2019年的净收益率大于10并且销售量大于100的销售负责人名字
复杂查询
对于更复杂的查询,如分组和排序,ChatSQL 同样支持:
请根据年份进行分组查询货物销售量和年份
请帮我按照数量大小对货物名称进行排序
典型生态项目
ChatSQL 作为一个自然语言转 SQL 的工具,可以与其他数据分析和可视化工具结合使用,例如:
- Jupyter Notebook: 用于数据分析和可视化。
- Tableau: 用于高级数据可视化。
- Pandas: 用于数据处理和分析。
这些工具可以与 ChatSQL 结合,提供从数据查询到数据分析和可视化的完整解决方案。
通过以上步骤和案例,你可以快速上手并充分利用 ChatSQL 进行数据库查询和数据分析。希望本教程对你有所帮助!
【免费下载链接】ChatSQL 项目地址: https://gitcode.com/gh_mirrors/ch/ChatSQL
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考



