本节目标:
索引
事务
1.索引
1.1概念
索引是一种特殊的文件,包含着对数据表里所有记录的引用指针。可以对表中的一列或多列创建索引,并指定索引的类型,各类索引有自己的数据结构实现。
1.2作用
数据库中的库、数据、索引之间的关系,类似于书架上图书、书籍内容和书籍目录的关系。
索引所起的作用类似书籍目录,可用于快速定位、检索数据。
索引对于提高数据库的性能有很大的帮助。
1.3使用场景
要考虑对数据库的某列或某几列创建索引,需要考虑以下几点:
数据量较大,且经常对这些列进行条件查询。
该数据库表的插入操作,及对这些列的修改操作频率较低。
索引会占用额外的磁盘空间。
满足以上条件时,考虑对表中的这些字段创建索引,以提高查找效率。
反之,如果非条件查询列,或经常做插入、修改操作,或磁盘空间不足时,不考虑创建索引。
1.4使用
创建主键约束(PRIMARY KEY)、唯一约束(UNIQUE)、外键约束(FOREIGN KEY)时,会自动创建对应列的索引。
查看索引:
show index from 表名;
案例:查看学生表已有的索引
show index from student;
创建索引
对于非主键、非唯一约束、非外键约束的字段,可以创建普通索引
create index 索引名 on 表名(字段名);
案例:创建班级表,name字段的索引
create index idx_classes_name on classes(name)
删除索引
drop index 索引名 on 表名;
案例:删除班级表中name字段的索引
drop index idx_classes_name on classes;
1.5案例
准备测试表:
-- 创建用户表
DROP TABLE IF EXISTS test_user;
CREATE TABLE test_user (
id_number INT,
name VARCHAR(20) comment '姓名’,
age INT comment '年龄‘,
create_time timestamp comment '创建日期'
);
准备测试数据,批量插入用户数据(操作耗时较长,约在1小时+);
-- 产生名字
DROP FUNCTION IF EXISTS rand_name;
DELIMITER $$
CREATE FUNCTION rand_name(n INT, l INT)
RETURNS VARCHAR(255)
BEGIN
DECLARE return_str VARCHAR(255) DEFAULT '';
DECLARE i INT DEFAULT 0;
WHILE i < n DO
IF i = 0 THEN
SET return_str = rand_string(l);
ELSE
SET return_str = CONCAT(return_str, CONCAT(' ', rand_string(l)));
END IF;
SET i = i + 1;
END WHILE;
RETURN return_str;
END $$
DELIMITER ;
-- 产生随机字符串
DROP FUNCTION IF EXISTS rand_string;
DELIMITER $$
CREATE FUNCTION rand_string(n INT)
RETURNS VARCHAR(255)
BEGIN
DECLARE lower_str VARCHAR(100) DEFAULT 'abcdefghijklmnopqrstuvwxyz';
DECLARE upper_str VARCHAR(100) DEFAULT 'ABCDEFJHIJKLMNOPQRSTUVWXYZ';
DECLARE return_str VARCHAR(255) DEFAULT '';
DECLARE i INT DEFAULT 0;
DECLARE tmp INT DEFAULT 5 + rand_num(n);
WHILE i < tmp DO
IF i = 0 THEN
SET return_str = CONCAT(return_str, SUBSTRING(upper_str, FLOOR(1 + RAND() * 26), 1));
ELSE
SET return_str = CONCAT(return_str, SUBSTRING(lower_str, FLOOR(1 + RAND() * 26), 1));
END IF;
SET i = i + 1;
END WHILE;
RETURN return_str;
END $$
DELIMITER ;
-- 产生随机数字
DROP FUNCTION IF EXISTS rand_num;
DELIMITER $$
CREATE FUNCTION rand_num(n INT)
RETURNS INT(5)
BEGIN
DECLARE i INT DEFAULT 0;
SET i = FLOOR(RAND() * n);
RETURN i;
END $$
DELIMITER ;
-- 向用户表批量添加数据
DROP PROCEDURE IF EXISTS insert_user;
DELIMITER $$
CREATE PROCEDURE insert_user(IN start INT(10), IN max_num INT(10))
BEGIN
DECLARE i INT DEFAULT 0;
SET autocommit = 0;
REPEAT
SET i = i + 1;
INSERT INTO test_user
VALUES ((start + i), rand_name(2, 5), rand_num(120), CURRENT_TIMESTAMP);
UNTIL i = max_num
END REPEAT;
COMMIT;
END $$
DELIMITER ;
-- 执行存储过程,添加 8000000 条用户记录
CALL insert_user(1, 8000000);
查询id_number为778899的用户信息:
-- 可以看到耗时4.93秒,这还是在本机一个人来操作,在实际项目中,如果放在公网中,假如同时有1000
个人并发查询,那很可能就死机。
select * from test_user where id_number=556677;
可以使用explain来进行查看SQL的执行:
explain select * from test_user where id_number=556677;
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: test_user
type: ALL
possible_keys: NULL
key: NULL <== key为null表示没有用到索引
key_len: NULL
ref: NULL
rows: 6
Extra: Using where
1 row in set (0.00 sec)
未提供查询速度,创建id_number字段的索引:
create index idx_test_user_id_number on test_user(id_number);
换一个身份证号查询,并比较执行时间:
select * from test_user where id_number=776655;
可以使用explain来进行查看SQL的执行:
explain select * from test_user where id_number=776655;
*************************** 1. row *************************** id: 1
select_type: SIMPLE
table: test_user type: ref
possible_keys: idx_test_user_id_number
key: idx_test_user_id_number <= key用到了idx_test_user_id_number key_len: NULL
ref: const rows: 1
Extra: Using where
1 row in set (0.00 sec)
索引保存的数据结构主要为B+树,及hash的方式。
2.事务
2.1为什么使用事务
准备测试表:
drop table if exists accout;
create table accout(
id int primary key auto_increment, name varchar(20) comment '账户名称', money decimal(11,2) comment
'金额'
);
insert into accout(name, money) values ('阿里巴巴', 5000),
('四十大盗', 1000);
比如说,四十大盗把从阿里巴巴的账户上偷盗了2000元
-- 阿里巴巴账户减少2000
update accout set money=money-2000 where name = '阿里巴巴';
-- 四十大盗账户增加2000
update accout set money=money+2000 where name = '四十大盗';
假如在执行以上第一句SQL时,出现网络错误,或是数据库挂掉了,阿里巴巴的账户会减少2000,但是四十大盗的账户上就没有了增加的金额。
解决方案:使用事务来控制,保证以上两句SQL要么全部执行成功,要么全部执行失败。
2.2事务的概念
事务指逻辑上的一组操作,组成这组操作的各个单元,要么全部成功,要么全部失败。
在不同的环境中,都可以有事务。对应在数据库中,就是数据库事务。
2.3使用
(1)开启事务:start transaction
(2)执行多条SQL语句
(3)回滚或提交:rollback/commit;
说明:rollback即是全部失败,commit即是全部成功。
start transaction;
-- 阿里巴巴账户减少2000
update accout set money=money-2000 where name = '阿里巴巴';
-- 四十大盗账户增加2000
update accout set money=money+2000 where name = '四十大盗';
commit;
事务的特性和设置,在后续的更多文章中会讲解。
3.内容重点总结
索引:
- 对于插入、删除数据频率高的表,不适用索引
- 对于某列修改频率高的,该列不适用索引
- 通过某列或某几列的条件查询频率高的,可以对这些列创建索引
事务:
start transaction;
...
rollback/commit;