✍个人博客:https://blog.youkuaiyun.com/Newin2020?spm=1011.2415.3001.5343
📚专栏地址:https://blog.youkuaiyun.com/Newin2020/article/details/127933422
📝视频地址:黑马程序员 MySQL数据库入门到精通
📣专栏定位:这个专栏我将会整理 B 站黑马程序员的 MySQL 入门课程的笔记,大家可以根据笔记辅助听课~
❤️如果有收获的话,欢迎点赞👍收藏📁,您的支持就是我创作的最大动力💪
五、锁
1. 概述
介绍
锁是计算机协调多个进程或线程并发访问某一资源的机制。在数据库中,除传统的计算资源(CPU
、RAM
、I/O
)的争用以外,数据也是一种供许多用户共享的资源。如何保证数据并发访问的一致性、有效性是所有数据库必须解决的一个问题,锁冲突也是影响数据库并发访问性能的一个重要因素。从这个角度来说,锁对数据库而言显得尤其重要,也更加复杂。
分类
MySQL
中的锁,按照锁的粒度分,分为以下三类:
- 全局锁:锁定数据库中的所有表。
- 表级锁:每次操作锁住整张表。
- 行级锁:每次操作锁住对应的行数据。
2. 全局锁
介绍
全局锁就是对整个数据库实例加锁,加锁后整个整个实例就处于只读状态,后续的 DML
的写语句,DDL
语句,已经更新操作的事务提交语句都将被阻塞。
将典型的使用场景是做全库的逻辑备份,对所有的表进行锁定,从而获取一致性视图,保证数据的完整性。
没加锁之前(数据不一致):
加锁过程:
加锁
flush tables with read lock;
备份数据
注意下面这个命令需要在 windows
下的命令行执行:
mysqldump -uroot -p1234 itcast > itcast.sql
解锁
unlock tables;
特点
数据库中加全局锁,是一个比较重的操作,存在以下问题:
- 如果在主库上备份,那么在备份期间都不能执行更新,业务基本上就得停摆。
- 如果在从库上更新,那么在备份期间不能执行主库同步过来的二进制日志(binlog),会导致主从延迟。
在 InnoDB
引擎中,我们可以在备份时加上参数 --single-transaction
参数来完成不加锁的一致性数据备份。
mysqldump --single-transaction -uroot -p123456 itcast > itcast.sql
3. 表级锁
介绍
表级锁,每次操作锁住整张表。锁定粒度大,发生锁冲突的概率最高,并发度最低。应用在 MyISAM
、InnoDB
、BDB
等存储引擎中。
对于表级锁,主要分为以下三类:
- 表锁
- 元数据锁(
meta data lock
,MDL
) - 意向锁
表锁
对于表锁,分为两类:
读锁不会阻塞其他客户端的读,但会阻塞写。写锁既会阻塞其他客户端的读,又会阻塞其他客户端的写。
- 表共享读锁(
read lock
)
- 表独占写锁(
write lock
)
注意:上面两图左边代表本客户端的操作,右边代表其他客户端的操作,并且绿色代表课操作,红色代表不可操作。
语法:
- 加锁:
lock tables 表名... read/write
- 释放锁
unlock tables / 客户端断开连接
元数据锁
MDL
加锁过程是系统自动控制,无需显示使用,在访问一张表的时候会自动加上。MDL
锁主要作用是维护表元数据的数据一致性,在表上有活动事务的时候,不可以对元数据进行写入操作。为了避免 DML
与 DDL
冲突,保证读写的正确性。
在 MYSQL5.5
中引入 MDL
,当对一张表进行增删改查的时候,加 MDL
读锁(共享);当对表结构进行变更操作的时候,加 MDL
写锁(排他)。
对应SQL | 锁类型 | 说明 |
---|---|---|
lock tables xxx read/write | SHARED_READ_ONLY/SHARED_NO_READ_WRITE | |
select 、select … lock in share mode | SHARED_READ | 与 SHARED_READ 、SHARED_WRITE 兼容,与 EXCLUSIVE 互斥 |
insert 、update 、delete 、select … for update | SHARED_WRITE | 与 SHARED_READ 、SHARED_WRITE 兼容,与 EXCLUSIVE 互斥 |
alter table … | EXCLUSIVE | 与其它的 MDL 都互斥 |
查看元数据锁:
select object_type,object_schema,object_name,lock_type,lock_duration from performance_schema.metadata_locks;
意向锁
为了避免 DML
在执行中,加的行锁与表锁的冲突,在 InnoDB
中引入了意向锁,使得表锁不用检查没行数据是否加锁,使用意向锁来减少表锁的检查。
- 意向共享锁(
IS
):由语句select ... lock in share mode
添加。与表锁共享锁(read
)兼容,与表锁排他锁(write
)互斥。 - 意向排他锁(
IX
):由insert 、update 、delete 、select ... for update
添加。与表锁共享锁(read
)及与排他锁(write
)都互斥。意向锁之间不会互斥。
可以通过一下 SQL
,查看意向锁及行锁的加锁情况:
select object_schema,object_name,index_name,lock_type,lock_mod,lock_data from performance_schema.data locks;
4. 行级锁
介绍
行级锁,每次操作锁住对应的行数据。行定粒度最小,发生锁冲突的概率最低,并发度最高。应用在 InnoDB
存储引擎中。
InnoDB
的数据是基于索引组织,行锁是通过对索引上的索引项加锁来实现的,并不是对记录加的锁。对于行级锁,主要分为以下三类:
- 行锁(
Record Lock
):锁定单个行记录的锁,防止其他事物对此进行update
和delete
。在RC
、RR
隔离级别下都支持。 - 间隙锁(
Gap Lock
):锁定索引记录间隙(不含该记录),确保索引记录间隙不变,防止其他事物在这个间隙进行insert
,产生幻读。在RR
隔离级别下都支持。 - 临键锁(
Next-Key Lock
):行锁和间隙锁组合,同时锁住数据,并锁住数据前面的间隙Gap
。在RR
隔离级别下支持。
行锁
InnoDB
实现了以下两种类型的行锁:
- 共享锁(
S
):允许一个事物去读一行,阻止其他事物获得相同数据集的排他锁。 - 排他锁(
X
):允许获取排他锁的事物更新数据,阻止其他事物获得相同数据集的共享锁和排他锁。
当前锁类型\请求所类型 | S(共享锁) | X(排他锁) |
---|---|---|
S(共享锁) | 兼容 | 冲突 |
X(排他锁) | 冲突 | 冲突 |
SQL | 行锁类型 | 说明 |
---|---|---|
INSERT … | 排他锁 | 自动加锁 |
UPDATE … | 排他锁 | 自动加锁 |
DELETE … | 排他锁 | 自动加锁 |
SELECT(正常) | 不加任何锁 | |
SELECT … LOCK IN SHARE MODE | 共享锁 | 需要手动在 SELECT 之后加 LOCK IN SHARE MODE |
SELECT … FOR UPDATE | 排他锁 | 需要手动在 SELECT 之后 FOR UPDATE |
默认情况下,InnoDB
在 REPEATEABLE READ
事物隔离级别运行,InnoDB
使用 next_key
锁进行搜索和索引扫描,以防止幻读。
- 针对唯一索引进行检索时,对已存在的记录进行等值匹配时,将会自动优化为行锁。
InnoDB
的行锁是针对于索引加的锁,不通过索引条件检索数据,那么InnoDB
将对表中的所有记录加锁,此时升级为表锁。
可以通过以下 SQL
,查看意向锁及行锁的加锁情况:
select object_schema,object_name,index_name,lock_type,lock_mod,lock_data from performance_schema.data_locks;
间隙锁/临键锁
默认情况下,InnoDB
在 REPEATABLE READ
事务隔离级别运行,InnoDB
使用 next_key
锁进行搜索和索引扫描,以防止幻读。
- 索引上的等值查询(唯一索引),给不存在的记录加锁时,优化为间隙锁。
- 索引上的等值查询(普通索引),向右遍历时最后一个值不满足查询需求时,
next-key lock
退化为间隙锁。 - 索引上的范围查询(唯一索引)–会访问到不满足条件的第一个值为止。
注意: 间隙锁唯一目的是防止其他事物插入间隙。间隙锁可以共存,一个事物采用的间隙锁不会阻止另一个事务在同一间隙锁上采用间隙锁。
5. InnoDB引擎
逻辑存储结构
- 表空间(
ibd
文件):一个MySQL
实例可以对应多个表空间,用于存储记录、索引等数据。 - 段:分为数据段(
Leaf node segment
)、索引段(Non-leaf node segment
)、回滚段(Rollback segment
),InnoDB
是索引组织表,数据段就是B+
树的叶子结点,索引段就是B+
树的非叶子结点。段用来当管理多个Extent
(区) 。 - 区:表空间的单元结构,每个区的大小为
1M
。默认情况下,InnoDB
存储引擎页大小为16K
,即一个区中一共有64
个连续的页。 - 页:是
InnoDB
存储引擎磁盘管理的最小单元,每个页的大小默认为16KB
。为了保证页的连续性,InnoDB
存储引擎每次从磁盘申请4-5
个区。 - 行:
InnoDB
存储引擎数据就是按行进行存放的。
架构
MySQL5.5
版本开始,默认使用 InnoDB
存储引擎,它擅长事务处理,具有崩溃恢复特性,在日常开发中使用非常广泛。下面是 InnoDB
架构图,左侧为内存结构,右侧为磁盘结构。
内存结构
磁盘结构
后台线程
事务原理
事务
事务是一组操作的集合,它是一个不可分割的工作单位,事务会把所有的操作作为一个整体一起向系统提交或撤销操作请求,即这些操作要么同时成功,要么同时失败。
特性
- 原子性:事务是不可分割的最小操作单元,要么全部成功,要么全部失败。
- 一致性:事务完成时,必须使所有的数据都保持一致状态。
- 隔离性:数据库提供的隔离机制,保证事务在不受外部并发操作影响的独立环境下与运行。
- 持久性:事务一旦提交或回滚,它对数据库中的数据的改变就是永久的。
redo log(持久性)
重做日志,记录的是事务提交时数据页的物理修改,是用来实现事务的永久性。
该日志文件由两部分组成:重做日志缓冲(redo log buffer
)以及重做日志文件(redo log file
),前者是在内存中,后者在磁盘中。当事务提交之后会把所有修改信息都存到该日志文件中,用于在刷新脏页到磁盘,发生错误时,进行数据恢复使用。
undo log(原子性)
回滚日志,用于记录数据被修改前的信息,作用包含两个:提供回滚和 MVCC
(多版本并发控制)。
undo log
和 redo log
记录物理日志不一样,它是逻辑日志。可以认为当 delete
一条记录时,undo log
中会记录一条对应的 insert
记录,反之亦然,当 update
一条记录时,它记录一条对应相反的 update
记录。当执行 rollback
时,就可以从 undo log
中的逻辑记录读取到相应的内容并进行回滚。
Undo log
销毁:undo log
在事务执行时产生,事务提交时,并不会立即删除 undo log
,因为这些日志可能还用与 MVCC
。
Undo log
存储:undo log
采用段的方式进行管理和记录,存放在前面介绍的 rollback segment
回滚段中,内部包含 1024
个 undo log segment
。
MVCC
基本概念
-
当前读
读取的是记录的最新版本,读取时还要保证其他并发事务不能修改当前记录,会对读取的记录进行加锁。对于我们日常的操作,如:
select ... lock in share mode
(共享锁),select ... for update、update、insert、delete
(排他锁)都是一种当前读。 -
快照读
简单的
select
(不加锁)就是快照读,读取的是记录数据的可见版本,有可能是历史数据,不加锁,是非阻塞读。Read Committed
:每次select
,都生成一个快照读。Repeatable Read
:开启事务后第一个select
语句才是快照读的地方。Serializable
:快照读会退化成当前读。
-
MVCC
全称
Multi-Version Concurrency Control
,多版本并发控制。指维护一个数据的多版本,使得读写操作没有冲突,快照读为MySQL
实现MVCC
提供了一个非阻塞读功能。MVCC
的具体实现,还需要依赖于数据库记录中的三个隐式字段、undo log
日志和readView
。
实现原理
-
记录中的隐藏字段
隐藏字段 含义 DB_TRX_ID 最近修改事务 ID ,记录插入这条记录或最后一次修改该记录的事务 ID DB_ROLL_PTR 回滚指针,指向这条记录的上一个版本,用于配合 undo log ,指向上一个版本 DB_ROW_ID 隐藏主键,如果表结构没有指定主键,将会生成该隐藏字段 -
undo log
回滚日志,在
insert、update、delete
的时候产生的便于数据回滚的日志。当
insert
的时候,产生的undo log
日志只在回滚时需要,在事务提交后,可被立即删除。而
update、delete
的时候,产生的undo log
日志不仅在回滚时需要,在快照读时也需要,不会立即被删除。 -
undo log
版本链不同事物或相同事物对同一条记录进行修改,会导致该记录的
undolog
生成一条记录版本链表,链表的头部是最新的旧记录,链表尾部是最早的旧记录。
-
readview
ReadView
(读视图)是快照读SQL
执行时MVCC
提取数据的依据,记录并维护系统当前活跃的事务(未提交的)id
。ReadView
中包含了四个核心字段:字段 含义 m_ids 当前活跃的事务 ID 集合 min_trx_id 最小活跃事务 ID max_trx_id 预分配事务 ID ,当前最大事务 ID+1(因为事务 ID 是自增的) creator_trx_id ReadView 创建者的事务 ID trx_id
:代表是当前事务ID
。不同隔离级别,生成
ReadView
的时机不同:READ COMMITTED
:在事务中每一次执行快照读时生成的ReadView
。REPEATABLE READ
:仅在事务中第一次执行快照读时生成ReadView
,后续复用该ReadView
。
RC
隔离级别下,在事务中每一次执行快照读生成ReadView
。RR
隔离级别下,仅在事务中第一次执行快照读生成ReadView
,后续复用该ReadView
。
6. MySQL管理
系统数据库
MySQL
数据库安装完成后,自带了以下四个数据库,具体作用如下:
数据库 | 含义 |
---|---|
mysql | 存储 MySQL 服务器正常运行所需要的各种信息(时区、主从、用户、权限等) |
information_schema | 提供了访问数据库元数据的各种表和视图,包含数据库、表、字段类型及访问权限等 |
performance_schema | 为 MySQL 服务器运行时状态提供了一个底层监控功能,主要用于收集数据库服务器性能和参数 |
sys | 包含了一系列方便 DBA 和开发人员利用 performance_schma 性能数据库进行性能调优和诊断的视图 |
常用工具
-
MySQL
该
MySQL
不是指MySQL
服务,而是指MySQL
的客户端工具。语法: mysql [options][database] 选项: -u, --user=name #指定用户名 -p, --password[=name] #指定密码 -h, --host=name #指定服务器IP或域名 -P, --port=port #指定连接端口 -e, --execute=name #执行SQL语句并退出
-e
选项可以在MySQL
客户端执行SQL
语句,而不用连接到MySQL
数据库再执行,对于一些批处理脚本,这种方式尤其方便。示例: mysql -h192.168.200.202 -P3306 -uroot -p1234 itcast -e "select * from stu"
-
mysqladmin
mysqladmin
是一个执行管理操作的客户端程序。可以用它来检查服务器的配置和当前状态、创建并删除数据库等。通过帮助文档查看选项: mysqladmin --help 示例: mysqladmin -uroot -p123456 drop 'test01'; musqladmin -uroot -p123456 version;
-
mysqlbinlog
由于服务器生成的二进制日志文件以二进制格式保存,所以如果想要检查这些文本的文本格式,就会使用到
mysqlbinlog
日志管理工具。语法: mysqlbinlog [options] log-files1 log-files2 ... 选项: -d, --database=name #指定数据库名称,只列出指定的数据库相关操作 -o, --offset=# #忽略掉日志中的前n行命令 -r, --result-file=name #将输出的文本格式日志输出到指定文件 -s, --short-form #显示简单个格式,省略掉一些信息 --start-datatime=date1 --stop-datetime=date2 #指定日期间隔内的所有日志 --start-postion=pos1 --stop-postion=pos2 #指定位置间隔内的所有日志
-
mysqlshow
mysqlshow
客户端对象查找工具,用来很快地查找存在哪些数据库、数据库中的表、表中的列或索引。语法: mysqlshow [options][db_name[table_name[col_name]]] 选项: --count #显示数据库及表的统计信息(数据库,表均可以不指定) -i #显示指定数据库或者指定表的状态信息 示例: #查询每个数据库的表的数量及表中记录的数量 mysqlshow -uroot -p2143 --count #查询test库中每个表中的字段数,及行数 mysqlshow -uroot -p2143 --count #查询test库中book表的详细情况 mysqlshow -uroot -p2143 test book --count
-
mysqldump
mysqldump
客户端工具用来备份数据库或在不同数据库之间进行数据迁移。备份内容包含创建表,及插入表的SQL
语句。语法: mysqldump [options] db_name [tables] mysqldump [options] --database/-B db1 [db2 db3 ...] mysqldump [options] -all-databases/-A 连接选项: -u, --user=name #指定用户名 -p, -password[=name] #指定密码 -h, --host=name #指定服务器ip或域名 -P, --port=# #指定连接端口 输出选项: --add-drop-database #在每个数据库创建语句前加上drop database语句 --add-drop-table #在每个表创建语句前加上rop table语句,默认开启;不开启(--skip-add-drop-table) -n, --no-create-db #不包含数据库的创建语句 -t, --no-create-info #不包含数据库的创建语句 -d, --no-dat #不包含数据 -T, --tab=name #自动生成两个文件:一个.sql文件,创建表结构的语句;一个.txt文件,数据文件
-
mysqlimport/souce
mysqlimport
是客户端数据导入工具,用来导入mysqldump
加-T
参数后导出的文本文件。语法: mysqlimport [options] db_name testfile1 [textfile2...] 示例: mysqlimport -uroot -p2143 test tmp/city.txt
如果需要导入
sql
文件,可以使用mysql
中的source
指令:语法: source /root/xxxxx.sql