sql语句优化的方法案例_sql优化案例-优快云博客

本文链接：https://blog.youkuaiyun.com/weimeilayer/article/details/145514850

使用合适的索引
案例：如果你有一个查询，涉及大量数据筛选条件，可以通过创建索引来提高查询效率。例如：

CREATE INDEX idx_name ON employees (last_name, first_name);

这样可以加速基于last_name和first_name字段的查询。
2. **避免使用SELECT ***
案例：只查询需要的列，避免使用SELECT *，减少返回数据量。

SELECT first_name, last_name FROM employees WHERE employee_id = 101;
比 
SELECT * FROM employees WHERE employee_id = 101; 更高效。

使用JOIN代替子查询
案例：子查询会增加查询的复杂度和执行时间，使用JOIN代替子查询往往能提高效率。

SELECT e.first_name, e.last_name 
FROM employees e
JOIN departments d ON e.department_id = d.department_id
WHERE d.department_name = 'Sales';

避免在WHERE子句中使用函数
案例：在WHERE子句中使用函数会导致数据库无法使用索引。应避免类似的情况：

-- 不推荐
SELECT * FROM employees WHERE YEAR(hire_date) = 2020;

-- 推荐
SELECT * FROM employees WHERE hire_date >= '2020-01-01' AND hire_date < '2021-01-01';

适当使用LIMIT
案例：如果只需要查询一定数量的数据，使用LIMIT可以减少不必要的计算。

SELECT * FROM employees LIMIT 100;

避免使用OR，改为IN
案例： OR通常比IN效率低，改用IN可以优化查询。

-- 不推荐
SELECT * FROM employees WHERE department_id = 1 OR department_id = 2;
-- 推荐
SELECT * FROM employees WHERE department_id IN (1, 2);

分区表
案例：对于大量数据表，可以使用分区表将数据按某些规则分开存储，从而提高查询性能。

CREATE TABLE employees (
    employee_id INT,
    department_id INT,
    hire_date DATE
)
PARTITION BY RANGE (YEAR(hire_date)) (
    PARTITION p2019 VALUES LESS THAN (2020),
    PARTITION p2020 VALUES LESS THAN (2021),
    PARTITION p2021 VALUES LESS THAN (2022)
);

优化JOIN条件
案例：确保JOIN时条件的顺序和效率。尽量让小表在前面，以减少内存占用。

SELECT a.name, b.salary 
FROM employees a
JOIN salaries b ON a.employee_id = b.employee_id;

避免使用DISTINCT
案例： DISTINCT通常会增加额外的计算和排序，只有在确实需要去重时再使用。

-- 不推荐
SELECT DISTINCT department_id FROM employees;
-- 推荐
SELECT department_id FROM employees;

优化GROUP BY和ORDER BY
案例： GROUP BY和ORDER BY可以增加查询时间，尤其是数据量很大的时候。尝试对相关列建立索引。

CREATE INDEX idx_department ON employees(department_id);
SELECT department_id, COUNT(*) FROM employees GROUP BY department_id ORDER BY COUNT(*) DESC;

合理使用事务
案例：在执行多个INSERT或UPDATE时，可以通过开启一个事务来减少磁盘写入的次数。

BEGIN TRANSACTION;
INSERT INTO employees (first_name, last_name) VALUES ('John', 'Doe');
INSERT INTO employees (first_name, last_name) VALUES ('Jane', 'Smith');
COMMIT;

使用缓存
案例：数据库层面可以启用查询缓存来缓存常见的查询结果。
– 启用缓存的具体方法依赖于数据库类型

SET GLOBAL query_cache_size = 1000000;

使用批量操作
案例：在插入大量数据时，批量操作会比逐条插入要快得多。

INSERT INTO employees (first_name, last_name) VALUES
('John', 'Doe'),
('Jane', 'Smith'),
('Robert', 'Johnson');

避免大量的更新操作
案例：尽量避免频繁的大量UPDATE操作，因为它们会影响性能。合并多个UPDATE语句，或者使用CASE语句。

UPDATE employees
SET department_id = CASE 
    WHEN department_id = 1 THEN 2
    WHEN department_id = 3 THEN 4
    ELSE department_id
END;

分析查询执行计划
案例：使用EXPLAIN分析查询执行计划，找出性能瓶颈。

EXPLAIN SELECT * FROM employees WHERE department_id = 10;

合理使用临时表
案例：临时表有助于分阶段处理复杂查询，避免复杂查询一次性执行过多计算。

CREATE TEMPORARY TABLE temp_table AS
SELECT * FROM employees WHERE department_id = 10;
SELECT * FROM temp_table WHERE hire_date > '2020-01-01';

优化NULL值查询
案例：对于包含NULL值的字段，避免直接在WHERE子句中用=或者!=比较。

-- 不推荐
SELECT * FROM employees WHERE department_id IS NULL;
-- 推荐
SELECT * FROM employees WHERE department_id IS NOT NULL;

避免在索引列上使用通配符
案例：在索引列上使用通配符（%）会导致数据库无法使用索引。

-- 不推荐
SELECT * FROM employees WHERE last_name LIKE '%Smith';
-- 推荐
SELECT * FROM employees WHERE last_name LIKE 'Smith%';

避免过多的连接
案例：在复杂查询中，避免连接过多的表，因为每增加一个表，查询的复杂度都会大大增加。

-- 不推荐
SELECT a.*, b.*, c.*, d.* FROM employees a 
JOIN departments b ON a.department_id = b.department_id
JOIN projects c ON a.project_id = c.project_id
JOIN salaries d ON a.salary_id = d.salary_id;
-- 推荐：减少连接的表
SELECT a.*, b.* FROM employees a 
JOIN departments b ON a.department_id = b.department_id;

考虑查询时的并行处理
案例：在一些支持并行查询的数据库中，可以配置查询并行处理来加速长时间运行的查询。
– 根据数据库设置并行查询

SELECT /*+ PARALLEL(employees, 4) */ * FROM employees;

避免使用子查询，改用JOIN
案例：子查询可能导致多次扫描表，而JOIN可以提高查询效率。

-- 不推荐
SELECT first_name, last_name FROM employees 
WHERE department_id = (SELECT department_id FROM departments WHERE department_name = 'Sales');

-- 推荐
SELECT e.first_name, e.last_name
FROM employees e
JOIN departments d ON e.department_id = d.department_id
WHERE d.department_name = 'Sales';

使用EXISTS代替IN
案例： EXISTS通常比IN性能更好，尤其是在处理大数据量时。

-- 不推荐
SELECT first_name, last_name FROM employees
WHERE department_id IN (SELECT department_id FROM departments WHERE department_name = 'Sales');
-- 推荐
SELECT first_name, last_name FROM employees e
WHERE EXISTS (SELECT 1 FROM departments d WHERE e.department_id = d.department_id AND d.department_name = 'Sales');

合理使用表连接的顺序
案例：对于多个JOIN的查询，按较小的表先连接，减少内存消耗。

SELECT e.first_name, e.last_name, d.department_name
FROM employees e
JOIN departments d ON e.department_id = d.department_id
JOIN salaries s ON e.salary_id = s.salary_id
ORDER BY e.last_name;

避免过多的UNION操作
案例： UNION会自动去重，可能会增加计算量。如果不需要去重，使用UNION ALL。

-- 不推荐
SELECT first_name FROM employees WHERE department_id = 10
UNION
SELECT first_name FROM employees WHERE department_id = 20;

-- 推荐
SELECT first_name FROM employees WHERE department_id = 10
UNION ALL
SELECT first_name FROM employees WHERE department_id = 20;

优化大数据量查询的分页
案例：使用LIMIT和OFFSET分页时，查询性能会随着数据量的增大而下降，使用WHERE来避免大OFFSET。

-- 不推荐
SELECT * FROM employees ORDER BY employee_id LIMIT 100 OFFSET 1000;

-- 推荐
SELECT * FROM employees WHERE employee_id > 1000 ORDER BY employee_id LIMIT 100;

定期清理数据库
案例：定期清理历史数据，尤其是对于大表，减少不必要的记录存储和查询负担。

DELETE FROM employees WHERE hire_date < '2000-01-01';

避免大批量的INSERT时的重复锁定
案例：在大批量的INSERT操作中，避免一次性插入大量数据。可以使用分批插入以避免锁定表过长时间。

-- 不推荐
INSERT INTO employees (first_name, last_name) VALUES (...), (...), ..., (...);  -- 数量过多时

-- 推荐
INSERT INTO employees (first_name, last_name) VALUES (...);
INSERT INTO employees (first_name, last_name) VALUES (...);

使用CASE表达式减少查询次数
案例：用CASE表达式合并多个查询条件，减少查询次数和中间结果集的生成。

SELECT 
    employee_id,
    first_name,
    last_name,
    CASE 
        WHEN department_id = 1 THEN 'Sales'
        WHEN department_id = 2 THEN 'Engineering'
        ELSE 'Other'
    END AS department_name
FROM employees;

避免使用过多的HAVING
案例： HAVING一般用于过滤聚合结果，但它通常会导致性能下降。优先使用WHERE来过滤数据。

-- 不推荐
SELECT department_id, COUNT(*) 
FROM employees 
GROUP BY department_id
HAVING COUNT(*) > 10;

-- 推荐
SELECT department_id, COUNT(*) 
FROM employees 
WHERE department_id IN (SELECT department_id FROM employees GROUP BY department_id HAVING COUNT(*) > 10)
GROUP BY department_id;

使用合适的数据类型
案例：数据类型应尽量小，以减少存储空间和提高处理效率。例如，使用INT而不是BIGINT，如果值不需要非常大的范围。

-- 不推荐
CREATE TABLE employees (
    employee_id BIGINT,
    department_id BIGINT,
    salary DECIMAL(15, 2)
);

-- 推荐
CREATE TABLE employees (
    employee_id INT,
    department_id INT,
    salary DECIMAL(10, 2)
);

避免使用LIKE模糊查询时的开头通配符
案例：在LIKE查询中使用开头的%会导致全表扫描，避免这种写法。

-- 不推荐
SELECT * FROM employees WHERE first_name LIKE '%John';

-- 推荐
SELECT * FROM employees WHERE first_name = 'John';

使用合适的批处理存储过程
案例：对于需要频繁执行的批量查询或更新，封装成存储过程以提高性能。

DELIMITER $$
CREATE PROCEDURE UpdateEmployeeSalary(IN emp_id INT, IN new_salary DECIMAL)
BEGIN
    UPDATE employees SET salary = new_salary WHERE employee_id = emp_id;
END $$
DELIMITER ;

监控数据库的慢查询日志
案例：启用慢查询日志，定期分析查询的执行时间并针对性优化。

SET GLOBAL slow_query_log = 'ON';
SET GLOBAL long_query_time = 2;  -- 设置超过2秒的查询为慢查询

分解复杂的查询
案例：将一个复杂的查询分解成多个简单的查询，通过临时表存储中间结果。

CREATE TEMPORARY TABLE temp AS
SELECT department_id, AVG(salary) AS avg_salary
FROM employees
GROUP BY department_id;

SELECT e.first_name, e.last_name, t.avg_salary
FROM employees e
JOIN temp t ON e.department_id = t.department_id;

避免频繁的表结构变更
案例：表结构的频繁更改会导致性能下降。尽量减少对表结构的修改。

-- 不推荐频繁修改表结构
ALTER TABLE employees ADD COLUMN address VARCHAR(255);
-- 推荐在设计时优化表结构

避免在WHERE子句中使用IS NULL与IS NOT NULL组合
案例： IS NULL和IS NOT NULL条件可能会导致索引失效，最好避免它们出现在同一个查询中，特别是当涉及到索引时。

-- 不推荐
SELECT * FROM employees WHERE department_id IS NULL OR department_id IS NOT NULL;

-- 推荐
SELECT * FROM employees WHERE department_id IS NOT NULL;

避免重复查询同一数据
案例：对同一数据执行多次查询，增加了不必要的开销。可以通过使用临时表或WITH语句来缓存数据，从而减少重复查询。

-- 不推荐
SELECT * FROM employees WHERE department_id = 1;
SELECT * FROM employees WHERE department_id = 1;

-- 推荐
WITH temp AS (SELECT * FROM employees WHERE department_id = 1)
SELECT * FROM temp;

避免使用不必要的LEFT JOIN
案例： LEFT JOIN会返回所有匹配的数据以及左表中不匹配的行，因此如果你只关心有匹配的数据，使用INNER JOIN会更高效。

-- 不推荐
SELECT e.first_name, d.department_name
FROM employees e
LEFT JOIN departments d ON e.department_id = d.department_id;

-- 推荐
SELECT e.first_name, d.department_name
FROM employees e
INNER JOIN departments d ON e.department_id = d.department_id;

避免多次查询相同数据
案例：对相同数据执行多个查询时，避免重复的访问，可以考虑使用缓存或者一次性查询所有相关数据。

-- 不推荐
SELECT * FROM employees WHERE department_id = 1;
SELECT * FROM employees WHERE department_id = 2;

-- 推荐
SELECT * FROM employees WHERE department_id IN (1, 2);

优化数据库连接池
案例：通过合理配置数据库连接池，避免每次查询时都创建和销毁数据库连接。这样能大幅减少连接创建的开销，尤其是在高并发的情况下。
– 这通常涉及到数据库连接池的配置，在应用层面优化
– 例如在Spring中设置合理的连接池大小

spring.datasource.hikari.maximum-pool-size=20;