1. 什么是普通索引和唯一性索引
- 定义:
- 普通索引:是最基本的索引类型,它为数据表中的某一列或多列建立索引,以加快数据的查询速度。它不限制索引列的值重复,允许存在多个相同的值。
- 唯一性索引:在普通索引的基础上,增加了索引列值必须唯一的约束条件,即该列中不允许出现重复的值,但可以有一个
NULL
值。
- 要点:
- 普通索引主要用于提高查询效率,不保证数据的唯一性。
- 唯一性索引在提高查询效率的同时,还能保证数据的唯一性。
- 应用:普通索引适用于经常用于查询条件但不要求唯一的数据列,如商品表中的商品类别列。唯一性索引适用于需要保证数据唯一性的列,如用户表中的邮箱列。
- SQL 代码举例:
sql
-- 创建表
CREATE TABLE users (
id INT PRIMARY KEY,
name VARCHAR(50),
email VARCHAR(100)
);
-- 创建普通索引
CREATE INDEX idx_name ON users (name);
-- 创建唯一性索引
CREATE UNIQUE INDEX idx_email ON users (email);
2. 什么是单个索引和复合索引
- 定义:
- 单个索引:是指在数据表的某一个列上创建的索引,用于加快对该列数据的查询速度。
- 复合索引:也叫组合索引,是在数据表的多个列上创建的索引,数据库会按照定义的列顺序来存储和检索数据。
- 要点:
- 单个索引适用于仅对单个列进行查询的场景。
- 复合索引在多列查询时能显著提高效率,但要遵循最左前缀原则。
- 应用:单个索引常用于单条件查询,如按用户年龄查询用户信息。复合索引适用于多条件查询,如同时按用户年龄和性别查询用户信息。
- SQL 代码举例:
sql
-- 创建表
CREATE TABLE products (
id INT PRIMARY KEY,
category VARCHAR(50),
price DECIMAL(10, 2),
stock INT
);
-- 创建单个索引
CREATE INDEX idx_category ON products (category);
-- 创建复合索引
CREATE INDEX idx_category_price ON products (category, price);
3. 什么是聚簇索引和非聚簇索引
- 定义:
- 聚簇索引:表数据按照索引的顺序进行存储,索引的叶子节点直接存储实际的数据行。一个表只能有一个聚簇索引。
- 非聚簇索引:索引的叶子节点存储的是指向实际数据行的指针,而不是数据本身。一个表可以有多个非聚簇索引。
- 要点:
- 聚簇索引能快速定位数据行,因为数据和索引存储在一起。
- 非聚簇索引需要先通过索引找到指针,再通过指针找到实际数据行,可能会增加磁盘 I/O。
- 应用:聚簇索引适用于需要快速定位数据的场景,如按主键查询。非聚簇索引适用于经常进行范围查询的列。
- SQL 代码举例:
sql
-- 创建表,InnoDB 中主键索引是聚簇索引
CREATE TABLE orders (
order_id INT PRIMARY KEY,
customer_id INT,
order_date DATE
) ENGINE=InnoDB;
-- 创建非聚簇索引
CREATE INDEX idx_customer_id ON orders (customer_id);
4. 什么是主索引和外键索引
- 定义:
- 主索引:通常指主键索引,是一种特殊的唯一性索引,用于唯一标识表中的每一行数据。一个表只能有一个主索引。
- 外键索引:用于建立和加强两个表数据之间的关联,保证数据的引用完整性。外键是一个表中的一列或多列,其值必须与另一个表的主键值匹配。
- 要点:
- 主索引确保表中数据的唯一性和快速查找。
- 外键索引维护表之间的关系,保证数据的一致性。
- 应用:主索引用于唯一标识表中的记录,如用户表中的用户 ID。外键索引用于关联不同表之间的数据,如订单表中的用户 ID 关联用户表的主键。
- SQL 代码举例:
sql
-- 创建用户表
CREATE TABLE users (
user_id INT PRIMARY KEY,
username VARCHAR(50)
);
-- 创建订单表
CREATE TABLE orders (
order_id INT PRIMARY KEY,
user_id INT,
order_date DATE,
FOREIGN KEY (user_id) REFERENCES users(user_id)
);
5. 什么是全文索引
- 定义:全文索引是一种特殊的索引类型,用于在文本数据中进行全文搜索。它会对文本内容进行分词处理,然后建立索引,以便快速查找包含特定关键词的文本。
- 要点:
- 全文索引适用于对大文本字段进行搜索,如文章内容、产品描述等。
- 它的搜索效率比使用
LIKE
关键字进行模糊查询要高。
- 应用:常用于搜索引擎、文章检索等需要对大量文本进行搜索的场景。
- SQL 代码举例:
sql
-- 创建表
CREATE TABLE articles (
article_id INT PRIMARY KEY,
title VARCHAR(200),
content TEXT
);
-- 创建全文索引
CREATE FULLTEXT INDEX idx_fulltext ON articles (content);
-- 使用全文索引进行搜索
SELECT * FROM articles WHERE MATCH(content) AGAINST('关键词');
6. 什么是空间索引
- 定义:空间索引是一种特殊的索引,用于对空间数据(如地理坐标、几何图形等)进行高效的存储和查询。它通过对空间数据进行划分和组织,使得可以快速定位和查询特定范围内的空间对象。
- 要点:
- 空间索引适用于处理地理信息系统(GIS)、地图应用等需要处理空间数据的场景。
- 它可以大大提高空间数据的查询效率。
- 应用:在地图应用中查找附近的商家、地理信息系统中查询特定区域内的地理对象等。
- SQL 代码举例:
sql
-- 创建表
CREATE TABLE locations (
location_id INT PRIMARY KEY,
name VARCHAR(50),
geom GEOMETRY
);
-- 创建空间索引
CREATE SPATIAL INDEX idx_spatial ON locations (geom);
7. InnoDB 与 MyISAM 引擎区别
- 定义:
- InnoDB:是 MySQL 的默认存储引擎,支持事务、外键、行级锁等特性。它使用聚簇索引来存储数据,数据和索引是存储在一起的。
- MyISAM:是 MySQL 早期的存储引擎,不支持事务和外键,只支持表级锁。它的索引和数据是分开存储的。
- 要点:
- InnoDB 适合对数据一致性要求较高、有事务处理需求的场景。
- MyISAM 适合对查询性能要求较高、对事务和外键没有要求的场景。
- 应用:InnoDB 常用于电商系统的订单表、银行系统的账户表等需要保证数据一致性和事务处理的场景。MyISAM 常用于日志表、统计报表表等对事务要求不高的场景。
- SQL 代码举例:
sql
-- 使用 InnoDB 引擎创建表
CREATE TABLE innodb_table (
id INT PRIMARY KEY,
name VARCHAR(50)
) ENGINE=InnoDB;
-- 使用 MyISAM 引擎创建表
CREATE TABLE myisam_table (
id INT PRIMARY KEY,
name VARCHAR(50)
) ENGINE=MyISAM;
8. 什么是脏读、幻读、可重复读、不可重复读
- 定义:
- 脏读:一个事务读取了另一个未提交事务修改的数据。如果另一个事务回滚,那么读取到的数据就是无效的。
- 不可重复读:一个事务在多次读取同一数据时,由于其他事务对该数据进行了修改并提交,导致每次读取的结果不一致。
- 可重复读:一个事务在执行过程中,多次读取同一数据时,无论其他事务是否对该数据进行了修改并提交,读取的结果都是一致的。
- 幻读:一个事务在执行过程中,根据某个条件查询到了一些数据,在该事务再次根据相同条件查询时,由于其他事务插入或删除了符合条件的数据,导致查询结果的行数发生了变化。
- 要点:
- 脏读是读取未提交的数据,会导致数据的不一致性。
- 不可重复读主要是针对数据的修改操作。
- 可重复读保证了在一个事务内多次读取同一数据的一致性。
- 幻读主要是针对数据的插入和删除操作。
- 应用:通过设置不同的事务隔离级别来避免这些问题,以满足不同的业务需求。
- SQL 代码举例:
sql
-- 设置事务隔离级别为可重复读
SET SESSION TRANSACTION ISOLATION LEVEL REPEATABLE READ;
-- 开始事务
START TRANSACTION;
-- 查询数据
SELECT * FROM users WHERE id = 1;
-- 其他事务可能会修改数据
-- 再次查询数据
SELECT * FROM users WHERE id = 1;
-- 提交事务
COMMIT;
9. 如何进行 SQL 优化
- 定义:SQL 优化是指通过对 SQL 查询语句、数据库表结构、索引等进行优化,以提高 SQL 查询的执行效率,减少查询时间和资源消耗。
- 要点:
- 索引优化:合理创建索引,避免创建过多或不必要的索引,遵循最左前缀原则。
- 查询语句优化:避免使用
SELECT *
,尽量使用EXISTS
代替IN
,使用UNION ALL
代替UNION
等。 - 表结构优化:合理设计表结构,避免数据冗余,使用合适的数据类型。
- 应用:在实际开发中,对经常执行的查询语句进行优化,以提高系统的性能。
- SQL 代码举例:
sql
-- 原查询语句
SELECT * FROM orders WHERE customer_id IN (SELECT customer_id FROM customers WHERE country = 'China');
-- 优化后的查询语句
SELECT o.* FROM orders o JOIN customers c ON o.customer_id = c.customer_id WHERE c.country = 'China';
10. 简介数据库特性 ACID
- 定义:ACID 是数据库事务的四个基本特性,用于保证数据库操作的一致性和可靠性。
- 原子性(Atomicity):一个事务中的所有操作要么全部成功,要么全部失败。如果事务中的任何一个操作失败,整个事务都会回滚到初始状态。
- 一致性(Consistency):事务执行前后,数据库的状态必须保持一致。也就是说,事务不能破坏数据库的完整性约束。
- 隔离性(Isolation):多个事务并发执行时,一个事务的执行不能被其他事务干扰。每个事务都应该感觉不到其他事务的存在。
- 持久性(Durability):一旦事务提交,它对数据库的修改就会永久保存,即使数据库发生故障也不会丢失。
- 要点:
- 原子性保证了事务的完整性。
- 一致性保证了数据的正确性。
- 隔离性保证了事务的并发执行。
- 持久性保证了数据的永久性。
- 应用:在需要保证数据一致性和可靠性的场景中,如银行转账、电商订单处理等,都需要使用事务来保证 ACID 特性。
- SQL 代码举例:
sql
-- 开始事务
START TRANSACTION;
-- 执行操作
UPDATE accounts SET balance = balance - 100 WHERE account_id = 1;
UPDATE accounts SET balance = balance + 100 WHERE account_id = 2;
-- 提交事务
COMMIT;
友情提示:本文已经整理成文档,可以到如下链接免积分下载阅读