数据库作为面试中的重要部分,当然也需要整理
1.为什么要优化
系统的吞吐量瓶颈往往出现在数据库的访问速度上,随着应用程序的运行,数据库的中的数据会越来越多,处理时间会相应变慢,数据是存放在磁盘上的,读写速度无法和内存相比
2.如何优化
设计数据库时:数据库表、字段的设计,存储引擎,利用好MySQL自身提供的功能,如索引等
横向扩展:MySQL集群、负载均衡、读写分离 SQL语句的优化(收效甚微)
3.字段设计
字段类型的选择,设计规范,范式,
常见设计案例
原则:尽量使用整型表示字符串
存储IP INET_ATON(str),address to number
INET_NTOA(number),number to address
MySQL内部的枚举类型(单选)和集合(多选)类型
但是因为维护成本较高因此不常使用,使用关联表的方式来替代enum
原则:定长和非定长数据类型的选择 decimal不会损失精度,存储空间会随数据的增大而增大。double占用固定空间,较大数的存储会损失精度。
非定长的还有varchar、text
金额 对数据的精度要求较高,小数的运算和存储存在精度问题(不能将所有小数转换成二进制)
定点数decimal price decimal(8,2)有2位小数的定点数,定点数支持很大的数(甚至是超过int,bigint存储范围的数)
小单位大数额避免出现小数 元->分
字符串存储 定长char,非定长varchar、text(上限65535,其中varchar还会消耗1-3字节记录长度,而text使用额外空间记录长度)
原则:尽可能选择小的数据类型和指定短的长度 原则:尽可能使用 not null 非null字段的处理要比null字段的处理高效些!且不需要判断是否为null。
null在MySQL中,不好处理,存储需要额外空间,运算也需要特殊的运算符。
如select null = null和select null <> null(<>为不等号)有着同样的结果,只能通过is null和is not null来判断字段是否为null。
如何存储?MySQL中每条记录都需要额外的存储空间,表示每个字段是否为null。
因此通常使用特殊的数据进行占位,比如int not null default 0、string not null default ‘’
原则:字段注释要完整,见名知意
原则:单表字段不宜过多 二三十个就极限了
原则:可以预留字段
在使用以上原则之前首先要满足业务需求
关联表的设计
外键foreign key只能实现一对一或一对多的映射
一对多 使用外键
多对多 单独新建一张表将多对多拆分成两个一对多
一对一 如商品的基本信息(item)和商品的详细信息(item_intro),通常使用相同的主键或者增加一个外键字段(item_id)
4.范式 Normal Format
数据表的设计规范,一套越来越严格的规范体系(如果需要满足N范式,首先要满足N-1范式)。
第一范式1NF:字段原子性 字段原子性,字段不可再分割。
关系型数据库,默认满足第一范式 注意比较容易出错的一点,在一对多的设计中使用逗号分隔多个外键,这种方法虽然存储方便,但不利于维护和索引(比如查找带标签java的文章)
第二范式:消除对主键的部分依赖
即在表中加上一个与业务逻辑无关的字段作为主键
主键:可以唯一标识记录的字段或者字段集合。
course_namecourse_
classweekday(周几)
course_teacherMySQL教育大楼
1525周一张三Java教育大楼
1521周三李四MySQL教育大楼
1521周五张三
依赖:A字段可以确定B字段,则B字段依赖A字段。 比如知道了下一节课是数学课,就能确定任课老师是谁。
于是周几和下一节课和就能构成复合主键,能够确定去哪个教室上课,任课老师是谁等。 但我们常常增加一个id作为主键,而消除对主键的部分依赖。
对主键的部分依赖:某个字段依赖复合主键中的一部分。
解决方案:新增一个独立字段作为主键。

本文深入探讨了Python中与数据库相关的面试热点,包括数据库优化的原因与方法、字段设计原则、存储引擎选择、索引管理和执行计划分析,以及避免性能陷阱的策略,如合理使用索引、避免全表扫描等。
最低0.47元/天 解锁文章
2660

被折叠的 条评论
为什么被折叠?



