SQL语句大全（从入门到精通实战手册）

原创于 2025-10-15 15:24:03 发布 · 1k 阅读

27 ·

CC 4.0 BY-SA版权

第一章：SQL语句的基本概念与环境搭建

SQL（Structured Query Language）是用于管理和操作关系型数据库的标准语言。它支持数据的查询、插入、更新和删除等操作，广泛应用于各类信息系统中。掌握SQL是进行数据分析、后端开发和数据库管理的基础。

什么是SQL

SQL是一种声明式语言，用户通过编写语句描述“想要什么”，而不是“如何实现”。其核心功能包括：

数据定义（DDL）：创建、修改、删除表结构
数据操作（DML）：插入、更新、删除、查询数据
数据控制（DCL）：管理权限和安全控制

环境准备与工具安装

推荐使用MySQL作为入门数据库系统。以下是安装与启动的基本步骤：

访问MySQL官网下载并安装MySQL Community Server
安装完成后，通过命令行启动服务：sudo systemctl start mysql
登录数据库：mysql -u root -p

创建测试数据库与表

执行以下SQL语句创建一个用于学习的用户表：


-- 创建数据库
CREATE DATABASE IF NOT EXISTS test_db;

-- 使用数据库
USE test_db;

-- 创建用户表
CREATE TABLE users (
  id INT AUTO_INCREMENT PRIMARY KEY,  -- 自增主键
  name VARCHAR(50) NOT NULL,          -- 用户名，非空
  email VARCHAR(100) UNIQUE           -- 邮箱，唯一
);

上述代码首先创建名为 test_db 的数据库，然后在其中建立 users 表，包含ID、姓名和邮箱字段。

常用客户端工具

为提升操作效率，可使用图形化工具连接数据库。常见工具包括：

工具名称	特点
MySQL Workbench	官方出品，功能全面
DBeaver	开源，支持多种数据库
phpMyAdmin	基于Web，适合本地开发

第二章：数据查询语言（DQL）核心语法与应用

2.1 SELECT基础查询与列筛选实战

在SQL查询中，`SELECT`语句是数据检索的基石。通过指定目标列，可精确获取所需字段，避免冗余数据传输。

基本语法结构

-- 查询员工表中的姓名和薪资
SELECT name, salary 
FROM employees;

上述语句从 `employees` 表中提取 `name` 和 `salary` 两列数据。`SELECT` 后列出需返回的字段名，`FROM` 指定数据源表。

使用星号通配符

* 表示选择所有列，适用于快速查看完整记录；
生产环境中应显式指定列名，提升查询性能与可维护性。

列别名增强可读性

-- 使用AS关键字为列设置别名
SELECT name AS 姓名, salary AS 薪资
FROM employees;

别名使输出结果更易理解，尤其在涉及计算或函数时尤为重要。

2.2 WHERE条件过滤与运算符灵活运用

在SQL查询中，WHERE子句是实现数据筛选的核心工具，它通过逻辑表达式对行数据进行条件过滤。合理使用比较运算符和逻辑运算符能显著提升查询精度。

常用比较运算符

=：等于
> / <：大于或小于
>= / <=：大于等于或小于等于
<> 或 !=：不等于
IN：匹配值列表中的任意一个
LIKE：支持通配符的模糊匹配

复合条件与逻辑运算符

SELECT * FROM users 
WHERE age >= 18 
  AND (city = 'Beijing' OR city = 'Shanghai')
  AND status IN ('active', 'pending');

该查询筛选出年龄大于等于18、城市为北京或上海，且状态为“active”或“pending”的用户记录。AND确保所有条件同时满足，OR提供多选路径，括号明确优先级。

NULL值处理

注意：使用IS NULL或IS NOT NULL判断空值，不可用=或!=，因为NULL参与的比较结果均为未知。

2.3 排序与分页：ORDER BY与LIMIT应用解析

在数据库查询中，排序与分页是数据展示的核心功能。通过 `ORDER BY` 可对结果集按指定列升序或降序排列，而 `LIMIT` 则控制返回记录的数量，二者结合广泛应用于列表分页场景。

排序基础语法

SELECT id, name, age FROM users ORDER BY age DESC;

该语句按年龄降序排列用户数据。`DESC` 表示降序，`ASC` 为升序（默认）。可指定多个排序字段，如 `ORDER BY dept ASC, salary DESC`，先按部门升序，再按薪资降序。

分页实现机制

SELECT * FROM products LIMIT 10 OFFSET 20;

此查询跳过前20条记录，返回接下来的10条，适用于第三页数据展示（每页10条）。`LIMIT 10` 等价于 `LIMIT 0, 10`，即从第0条开始取10条。

OFFSET 值从0开始，表示偏移量
LIMIT 数值决定每页大小
排序应优先执行，避免分页结果不一致

2.4 多表连接查询：INNER JOIN与OUTER JOIN实战

在关系型数据库中，多表连接是数据整合的核心操作。通过JOIN语句，可以基于关联字段将多个表的数据组合在一起。

INNER JOIN：仅返回匹配行

SELECT users.id, users.name, orders.amount
FROM users
INNER JOIN orders ON users.id = orders.user_id;

该查询仅返回在users和orders表中都存在匹配记录的行。若某用户无订单，则不会出现在结果中。

LEFT OUTER JOIN：保留左表全部记录

SELECT users.name, orders.amount
FROM users
LEFT OUTER JOIN orders ON users.id = orders.user_id;

即使用户没有订单，仍会显示该用户，订单字段为NULL，适用于统计“每个用户的消费情况”，包括未消费用户。

连接类型对比

类型	匹配行为	适用场景
INNER JOIN	仅返回两表匹配行	精确关联分析
LEFT JOIN	保留左表所有行	主表完整+辅表补充信息

2.5 聚合函数与GROUP BY分组统计技巧

在SQL查询中，聚合函数与GROUP BY子句结合使用，能够实现对数据的高效分组统计。常见的聚合函数包括COUNT()、SUM()、AVG()、MAX()和MIN()。

基本语法结构

SELECT department, COUNT(*) AS employee_count, AVG(salary) AS avg_salary
FROM employees
GROUP BY department;

该语句按部门分组，统计每个部门员工数量及平均薪资。GROUP BY后的字段必须出现在SELECT中（除非是聚合值），否则会引发SQL错误。

分组过滤：HAVING子句

WHERE用于行过滤，在分组前生效
HAVING用于过滤分组后的结果

例如，筛选员工数超过5的部门：

SELECT department, COUNT(*) AS cnt
FROM employees
GROUP BY department
HAVING COUNT(*) > 5;

此查询先完成分组统计，再通过HAVING筛选满足条件的组，体现聚合后逻辑判断能力。

第三章：数据操作语言（DML）深入实践

3.1 INSERT插入数据的多种方式与注意事项

在SQL中，INSERT语句是向数据库表中添加新记录的核心操作。最基础的语法为单行插入：

INSERT INTO users (id, name, email) VALUES (1, 'Alice', 'alice@example.com');

该语句明确指定目标表、字段列表和对应值。字段顺序无需与表结构一致，但必须与VALUES中的值一一匹配。

批量插入提升效率

为减少多次I/O开销，可使用多值插入语法：

INSERT INTO users (name, email) VALUES 
('Bob', 'bob@example.com'),
('Charlie', 'charlie@example.com'),
('Diana', 'diana@example.com');

此方式一次执行插入多条记录，显著提升性能，尤其适用于数据初始化或批量导入场景。

注意事项

确保插入数据类型与列定义兼容，避免类型转换错误
主键或唯一约束列不可重复，否则将导致插入失败
若未指定列名，需为所有字段提供值，且顺序与表结构一致

3.2 UPDATE更新记录的安全性与条件控制

在执行数据库UPDATE操作时，安全性与条件控制至关重要，不当的更新可能导致数据异常或信息泄露。

使用WHERE子句精确匹配目标记录

必须通过明确的条件限定更新范围，避免全表更新风险。例如：

UPDATE users 
SET last_login = NOW() 
WHERE user_id = 1001;

该语句仅更新用户ID为1001的记录。若省略WHERE子句，将导致所有用户的登录时间被修改，造成严重后果。

结合权限控制与预处理机制

数据库账户应遵循最小权限原则，限制对敏感字段的写入能力；
应用层宜采用参数化查询防止SQL注入攻击。

多条件复合判断提升安全性

可利用逻辑表达式增强条件可靠性：

UPDATE account 
SET balance = 5000 
WHERE user_id = 1001 
  AND status = 'active' 
  AND balance IS NOT NULL;

此语句确保仅对状态正常且余额非空的账户进行更新，有效防止非法状态变更。

3.3 DELETE与TRUNCATE删除数据的差异与场景选择

在数据库操作中，DELETE和TRUNCATE均可清除表中数据，但机制与适用场景存在本质区别。

执行机制对比

DELETE是DML操作，逐行删除数据，支持WHERE条件过滤，并触发事务日志记录与触发器。TRUNCATE为DDL操作，通过释放数据页快速清空整表，不支持条件筛选，日志记录较少，效率更高。

-- 使用DELETE删除满足条件的数据
DELETE FROM users WHERE created_at < '2023-01-01';

-- 使用TRUNCATE清空整个表
TRUNCATE TABLE users;

上述代码中，DELETE适用于需保留部分数据的场景，而TRUNCATE适用于彻底重置表且无需回滚的场合。

性能与事务影响

TRUNCATE执行速度更快，占用日志空间小
DELETE可回滚，TRUNCATE在多数数据库中不可回滚
TRUNCATE会重置自增列，DELETE则不会

应根据数据量、事务需求及是否需要条件删除来合理选择指令。

第四章：数据定义语言（DDL）与数据库结构管理

4.1 数据库与数据表的创建、修改与删除

在数据库管理中，合理组织数据结构是系统稳定运行的基础。首先通过 SQL 语句创建数据库和数据表，定义字段类型与约束条件。

创建数据库与数据表

CREATE DATABASE IF NOT EXISTS company_db;
USE company_db;

CREATE TABLE employees (
  id INT AUTO_INCREMENT PRIMARY KEY,
  name VARCHAR(100) NOT NULL,
  email VARCHAR(255) UNIQUE,
  hire_date DATE DEFAULT (CURRENT_DATE)
);

该语句首先创建名为 company_db 的数据库，避免重复创建。接着创建 employees 表，其中 id 为主键并自动递增，email 强制唯一，确保数据完整性。

修改与删除操作

使用 ALTER TABLE 可添加字段：

ALTER TABLE employees ADD COLUMN department_id INT;

如需删除表或数据库，使用 DROP TABLE employees; 或 DROP DATABASE company_db;，执行时需谨慎确认依赖关系。

4.2 字段约束：PRIMARY KEY、FOREIGN KEY与UNIQUE实战

在数据库设计中，合理使用字段约束能有效保障数据完整性。主键（PRIMARY KEY）确保每行记录的唯一性且非空，是表的核心标识。

约束类型对比

约束类型	允许NULL值	唯一性要求	数量限制（每表）
PRIMARY KEY	否	是	1
UNIQUE	是（单列）	是	多
FOREIGN KEY	是	否	多

外键关联示例

CREATE TABLE users (
  id INT PRIMARY KEY AUTO_INCREMENT,
  email VARCHAR(100) UNIQUE NOT NULL
);

CREATE TABLE orders (
  id INT PRIMARY KEY AUTO_INCREMENT,
  user_id INT,
  FOREIGN KEY (user_id) REFERENCES users(id) ON DELETE CASCADE
);

上述代码中，users.id 为主键，确保用户唯一；email 使用 UNIQUE 约束防止重复注册；orders.user_id 作为外键关联用户表，并启用级联删除，保障引用完整性。

4.3 索引的创建与优化策略详解

在数据库性能调优中，索引是提升查询效率的核心手段。合理设计索引结构能显著降低数据扫描量，加快检索速度。

常见索引类型选择

B-Tree索引：适用于等值和范围查询，如 WHERE age > 25
Hash索引：仅支持等值匹配，查询速度极快但不支持排序
复合索引：遵循最左前缀原则，优化多条件查询

创建高性能索引示例

CREATE INDEX idx_user_age_name ON users(age, name);
-- 基于age和name建立复合索引，适用于 WHERE age = 20 AND name LIKE '张%'

该语句创建的复合索引可有效支持以 age 为首要筛选条件、name 为次要条件的查询场景，避免全表扫描。

索引优化建议

策略	说明
避免过度索引	每个额外索引都会增加写操作开销
定期分析执行计划	使用 EXPLAIN 检查是否命中预期索引

4.4 视图的使用场景与性能影响分析

常见使用场景

视图常用于简化复杂查询、实现逻辑数据隔离和提升安全性。例如，在多表关联场景中，通过创建视图封装JOIN逻辑，使应用层查询更简洁。

CREATE VIEW employee_summary AS
SELECT 
  e.id, 
  e.name, 
  d.dept_name,
  COUNT(p.id) AS project_count
FROM employees e
JOIN departments d ON e.dept_id = d.id
LEFT JOIN projects p ON e.id = p.emp_id
GROUP BY e.id, e.name, d.dept_name;

上述视图将员工、部门与项目信息整合，外部调用仅需SELECT * FROM employee_summary，无需了解底层结构。

性能影响分析

优点：提升SQL可维护性，统一数据访问逻辑
缺点：嵌套视图可能导致执行计划劣化，尤其在未加索引的字段上进行过滤时

某些数据库（如MySQL）对视图采用合并或临时表算法，复杂视图可能引发全表扫描，建议结合EXPLAIN分析执行计划。

第五章：SQL性能优化与高级应用展望

索引策略的精细化设计

合理的索引设计是提升查询效率的核心。复合索引应遵循最左前缀原则，避免冗余索引导致写入性能下降。例如，在用户登录场景中，对 (status, created_at) 建立联合索引可显著加速活跃用户筛选：

-- 创建复合索引以支持高频查询
CREATE INDEX idx_user_status_created ON users (status, created_at DESC);
-- 查询示例：获取近一周的活跃用户
SELECT id, name FROM users 
WHERE status = 'active' 
  AND created_at >= NOW() - INTERVAL 7 DAY;

执行计划分析与调优

使用 EXPLAIN 分析 SQL 执行路径，识别全表扫描、临时表或文件排序等性能瓶颈。重点关注 type（访问类型）、key（使用的索引）和 rows（扫描行数）字段。

type 为 range 或 ref 表示使用了索引
rows 值过大提示需优化条件或索引
Extra 出现 Using filesort 需调整索引结构

分区表在大数据场景的应用

对于日志类时序数据，采用 RANGE 分区可大幅提升查询与维护效率。以下为按月分区的订单表结构示例：

分区名称	时间范围	数据量（预估）
p202401	2024-01-01 至 2024-01-31	120万
p202402	2024-02-01 至 2024-02-29	115万

[ 订单表 ] --按 month(created_at) 分区 --> [ p202401 | p202402 | p202403 ]