从零学 SQL + 大模型应用落地
文章平均质量分 92
玄同765
大语言模型(LLM)开发工程师|中国传媒大学·数字媒体技术(智能交互与游戏设计)
深耕领域:大语言模型开发/RAG知识库/AI Agent落地/模型微调
技术栈:Python/LangChain/RAG(Diffy+Redis+Milvus)| SQL/NumPy | FastAPI+Docker
️ 工程能力:专注模型工程化部署、知识库构建与优化,擅长全流程解决方案
「让AI交互更智能,让技术落地更高效」
欢迎技术探讨/项目合作!
关注我,解锁大模型与智能交互的无限可能!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Vim 编辑器完全入门指南:从零基础到高阶效率大师
Vim作为程序员的高效文本编辑器,凭借其键盘操作、跨平台兼容和轻量化等优势,在全球开发者中广受欢迎。本文系统介绍了Vim的核心功能:三种基本模式(普通、插入、命令行)及其切换方式;常用文本操作如移动、删除、复制粘贴;配置优化和插件扩展方法;以及宏录制、远程开发等高阶技巧。通过合理配置.vimrc文件和使用插件,Vim可以扩展为IDE级别的工具。文章强调Vim的学习曲线是先难后易,建议通过日常练习逐步掌握,最终实现编辑效率的质的飞跃。原创 2025-12-26 00:12:55 · 1582 阅读 · 29 评论 -
大模型应用 SQL 优化:10w + 对话历史的查询加速
本文针对大模型应用中的SQL性能优化问题,提出了一套专属解决方案。通过分析大模型应用的三大核心查询场景(连续对话、AI自动查询、RAG检索),重点介绍了复合覆盖索引和延迟关联优化技术,将典型查询从820ms优化至68ms(提升12倍)。文章还展示了如何通过AI SQL Agent自动生成优化SQL,并结合Redis缓存高频查询结果。最终形成完整的大模型应用SQL全栈解决方案,包括表设计规范、索引设计规范和Agent优化规范等可落地的checklist,实现了10w+对话历史数据的高效查询。原创 2025-12-21 20:14:58 · 950 阅读 · 10 评论 -
大模型 Agent 实战:让 AI 自动写 SQL 查业务库
本文介绍如何利用大模型SQLAgent实现自然语言转SQL查询业务数据。通过复用前几篇的PostgreSQL环境、FastAPI框架和权限控制,构建"自然语言→SQL→结果"的自动化链路。核心实现包括:1)配置SQLAgent连接业务库并限制只读权限;2)封装FastAPI接口供非技术人员调用;3)演示AI准确生成SQL并返回查询结果。文章还埋下性能优化伏笔,为下一篇解决10w+对话历史表查询慢问题做准备。原创 2025-12-21 20:03:05 · 851 阅读 · 4 评论 -
PostgreSQL+pgvector:大模型 RAG 的「结构化 + 向量」混合检索
本文介绍了如何利用PostgreSQL和pgvector实现企业级RAG应用的混合检索功能。文章首先阐述了混合检索的必要性,即同时满足结构化条件过滤和语义相似性检索的需求。随后详细讲解了使用Docker一键部署PostgreSQL+pgvector环境的方法,并指导读者创建包含向量字段和JSONB元数据的文档表。文章重点演示了混合检索的SQL实现,包括结构化过滤和向量检索的结合,以及如何在Python+FastAPI中封装成API接口。最后给出了企业级优化建议,如索引优化和性能优化技巧,为开发者提供了完整的原创 2025-12-20 15:03:09 · 1168 阅读 · 2 评论 -
从零动手:用 SQL+FastAPI 存储大模型对话历史
本文介绍如何用SQLite+FastAPI+SQLAlchemy搭建大模型对话历史存储系统。主要内容包括: 零配置搭建环境,只需Python3.10+和基础依赖 使用SQLAlchemy ORM创建对话历史表,对应前序SQL知识点 开发FastAPI接口实现对话存储和查询功能 提供模拟和真实大模型两种实现方案 配套可视化测试方法,验证SQL数据存储效果 系统特点:零基础友好、代码可复用、严格关联SQL知识点,适合大模型开发者快速实现对话历史管理功能。原创 2025-12-20 14:44:40 · 1014 阅读 · 10 评论 -
从 15 秒到 100 毫秒:SQL 运行效率提升的「分层优化方法论」
本文是面向主流数据库开发者的生产级 SQL 优化指南,以「某游戏公司 320 万条充值记录 SQL 从 14.7 秒优化至 98 毫秒」的真实案例为引子,分4 层优化方法论:基础语法层:禁止SELECT *、索引字段不做函数操作、UNION ALL替代UNION等禁忌;索引核心层:覆盖索引、最左匹配原则、索引避坑指南;执行计划层:用EXPLAIN定位慢 SQL 根源;高级优化层:分库分表、延迟关联、热点缓存等大数据量解决方案。文中附可直接运行的代码示例 + 官方文档依据,覆盖 99% 生产慢 S原创 2025-12-19 10:10:16 · 967 阅读 · 7 评论 -
SQL 多表连接 / 子查询:表名(别名)省略的「黑盒规则」与最佳实践
SQL表名省略规则核心摘要:多表连接时,仅当字段在连接表中唯一或使用USING子句时可省略表名;自连接、关联子查询和字段重复时必须显式指定表名/别名。生产环境建议强制显式表名以避免歧义错误,特别是应对表结构变更风险。临时调试或单表查询可适当省略,但复杂查询应通过规范别名(长度≤3字符)提升可读性和跨数据库兼容性。最佳实践是牺牲少量简洁性换取代码稳定性和可维护性。原创 2025-12-19 00:18:37 · 819 阅读 · 0 评论 -
MySQL 的「0 开始」与「1 开始」边界:全面梳理易踩坑的函数 / 关键字
摘要:本文系统梳理了MySQL中0起始和1起始的规则差异。0起始特性包括:LIMIT偏移量、JSON数组索引、WEEKDAY()函数返回值、时间组件函数;1起始特性包括:字符串函数位置参数、日期组件函数、数据库对象顺序、窗口函数编号等。文章分析了常见踩坑案例,如LIMIT1,5实际跳过首条数据、JSON数组$[0]才是首个元素等,并给出3个最佳实践:先查规则、明确语法、测试验证。最后附速查表帮助开发者快速区分不同场景的起始规则。原创 2025-12-18 10:34:45 · 841 阅读 · 10 评论 -
SQL 入门必修课:从零搭建数据查询能力
本文是面向 0 基础开发者的 SQL 入门必修课,覆盖核心模块:SELECT 基础检索、DDL 表结构设计(含大模型对话历史表实战)、DML 增删改(明确 UPDATE/DELETE 必须加 WHERE 的红线规则)、WHERE 过滤与排序、聚合分组统计、JOIN 多表关联。全内容配 100% 可运行在线代码,附 0 成本练习工具,关联大模型应用场景,文末赠 SQL 速查表福利,2 小时即可搭建完整数据查询能力。原创 2025-12-18 00:15:40 · 1018 阅读 · 0 评论 -
大模型应用必备 SQL:2 小时学会「仅需用的」最小语法子集
本文是面向大模型应用开发者 / 后端新手的轻量化 SQL 教程,聚焦「大模型场景必须用的最小语法子集」,解决 “开发者无需成为 SQL 专家却要支撑生产需求” 的核心痛点:核心价值:仅覆盖 95% 大模型生产场景(上下文回溯、RAG 混合检索、合规审计)所需的 15% SQL 语法,2 小时即可上手生产代码;内容框架:包含 2 种必用表结构(对话历史表、pgvector 版 RAG 文档表)、3 种核心查询(上下文加载、经修正的 pgvector 余弦距离混合检索、合规审计)、2 种索引优化(复合 B原创 2025-12-17 10:24:08 · 666 阅读 · 0 评论 -
大模型应用为什么离不开 SQL?向量库替代不了的 3 个核心场景
针对大模型开发者普遍踩过的「盲目依赖向量库」隐性坑(检索超时、上下文混乱、合规失效),本文明确SQL 是大模型应用不可替代的核心基础设施:向量库仅能覆盖「非结构化内容语义检索」,而 对话上下文精准回溯(延迟降 10 倍)、RAG 业务规则混合检索(性能提 100 倍)、金融 / 政务级合规审计(满足等保 2.0/GDPR)三大场景,因向量库的索引效率、ACID 事务、精细权限支持天生缺陷,必须依托 SQL 实现。文中提供 PostgreSQL+pgvector 可直接运行代码与标准存储架构。原创 2025-12-16 16:24:04 · 874 阅读 · 0 评论
分享