一、MYSQL数据库设计原则
1、核心原则
不在数据库做运算;
cpu计算务必移至业务层;
控制列数量(字段少而精,字段数建议在20以内);
平衡范式与冗余(效率优先;往往牺牲范式)
拒绝3B(拒绝大sql语句:big sql、拒绝大事务:big transaction、拒绝大批量:big batch);
2、字段类原则
用好数值类型(用合适的字段类型节约空间);
字符转化为数字(能转化的最好转化,同样节约空间、提高查询性能);
避免使用NULL字段(NULL字段很难查询优化、NULL字段的索引需要额外空间、NULL字段的复合索引无效);
少用text类型(尽量使用varchar代替text字段);
3、索引类原则
合理使用索引(改善查询,减慢更新,索引一定不是越多越好);
字符字段必须建前缀索引;
不在索引做列运算;
innodb主键推荐使用自增列(主键建立聚簇索引,主键不应该被修改,字符串不应该做主键)(理解Innodb的索引保存结构就知道了);
不用外键(由程序保证约束);
4、sql类原则
sql语句尽可能简单(一条sql只能在一个cpu运算,大语句拆小语句,减少锁时间,一条大sql可以堵死整个库);
简单的事务;
避免使用trig/func(触发器、函数不用客户端程序取而代之);
不用select *(消耗cpu,io,内存,带宽,这种程序不具有扩展性);
OR改写为IN(or的效率是n级别);
OR改写为UNION(mysql的索引合并很弱智);
OR改成UNION提升性能的前提是:OR连接的各条件字段要能用到索引
select id from user where phone = '18811112222' or nickname='空城。';
# 可以改写为
select id from user where nickname='空城。'
union
select id from user where phone='18811112222'
避免负向%;
limit高效分页(limit越大,效率越低);
使用union all替代union(union有去重开销,具体使用哪个看业务需求);
-
Union:对两个结果集进行并集操作,不包括重复行,同时进行默认规则的排序;
-
Union All:对两个结果集进行并集操作,包括重复行,不进行排序;
少用连接join;
使用group by;
请使用同类型比较;
打散批量更新;
二、数据库结构的优化
1、选择合适的数据类型
数据类型的选择,重点在于“合适”二字,如何确定选择的数据类型是否合适了?
1、 使用可以存下你的数据的最小的数据类型。(时间类型数据:可以使用varchar类型,可以使用int类型,也可以使用时间戳类型)
2、 使用简单的数据类型,int要比varchar类型在mysql处理上简单。(int类型存储时间是最好的选择)
3、 尽可能的使用not null定义字段。(innodb的特性所决定,非not null的值,需要额外的在字段存储,同时也会增加IO和存储的开销)
4、 尽量少用text类型,非用不可时最好考虑分表。
2.案例
(1)案例一
int类型存储时间-时间转换
使用int来存储日期时间,利用FROM_UNIXTIME(),UNIX_TIMESTAMP()两个函数来进行转换。
创建表
create table test(
id int auto_increment not null,
timestr int ,
primary key(id)
);
导入数据
insert into test (timestr) values (unix_timestamp('2019-08-14 19:00:00'));
查询数据
select FROM_UNIXTIME(timestr) from test;
结论:
1、unix_timestamp()函数是将日期格式的数据转换为int类型
2、FROM_UNIXTIME(timestr)函数是将int类型转换为时间格式
(2)案例2
ip地址的存储
在我们的外部应用中,都要记录ip地址,大部分场合都是varchar(15)进行存储,就需要15个字节进行存储,但是bigint只需要8个字节进行存储
创建表
create table sessions(
id int auto_increment not null,
ipaddress bigint,
primary key (id)
);
导入数据
insert into sessions (ipaddress)values (inet_aton('192.168.0.1'));
转换
select inet_ntoa(ipaddress) from sessions;
本文详细阐述了MYSQL数据库设计的四大原则,包括核心原则、字段类原则、索引类原则和SQL类原则,并通过案例展示了如何选择合适的数据类型,如使用int类型存储时间和使用bigint存储IP地址,以实现更高效的数据管理和查询。
679

被折叠的 条评论
为什么被折叠?



