1.选择合适数据类型
1.1.使用可以存储你数据类型的最小数据类型。
1.2.使用简单的数据类型。
1.3.尽量使用NOT NULL定义字段。
1.4.尽量少用大的类型(text),非用不可使用从表拆分出来。
1.5.例子:
1.5.1.利用Int类型存储日期类型:利用FROM_UNIXTIME()函数(int转日期类型)和UNIX_TIMESTAMP()函数(日期转为int类型)。
1.5.2.IP地址存储:使用BIGINT类型,利用INET_ATON()函数和INET_NTOA()函数(转回成IP)。
2.表的范式的优化
2.1.数据库三大范式:
1)每一列都是不可分割的基本数据项,同一列不能有多个值。
2)每个实例(行、记录)能够唯一的区分(主键)。
3)数据库表不包含其他数据库表中非主键关键字信息(减少字段冗余)。
3.表的反范式的优化
1)为了查找效率把符合第三范式的表增加适量的冗余,达到优化查询的目的,反范式优化是以空间换取时间的操作(严格遵循第三范式会导致很多使用临时表的SQL操作,会增加IO操作降低查询效率;此时通过SQL优化是达不到我们优化目的的只能修改表结构增加适量的冗余)。
4.表的垂直拆分(把含有多个列的表拆分成多个表,解决表宽度问题)
4.1.把不常用的字段单独放在同一个表中
4.2.把大字段独立放入一个表中
4.3.把经常使用的字段放在一起
5.表的水平拆分(为了解决数据表中数据过大的问题,水平拆分每一个表的结构都是完全一致的)
5.1.如何将数据平分到N张表中的常用方法:
1)对ID进行hash运算,如果要拆分成5个表,mod(id,5)取出0~4个值
2)针对不同的hashID将数据存入不同的表中
5.2.水平拆分带来的问题和挑战
1)跨分区表的数据查询
2)统计及后台报表的操作