1.基本概念
1.1 几个专有名词
1.3 DBMS的特征和分类
①数据结构化且统一管理。②有较高的数据独立性。③数据控制功能(数据库的安全性、完整性、并发控制、故障恢复)。
2.三级模式——两级映像
2.1 三级模式
①模式:也称概念模式,它是数据库中全体数据的逻辑结构和特征的描述。只涉及型的描述,不涉及具体的值。概念模式的一个具体值称为模式的一个实例,同一个模式可以有很多实例。描述模式的数据定义语言为:模式DDL。
②外模式:也称用户模式或子模式,是用户与数据库系统的接口,是用户看到的那部分数据的描述。 描述外模式的数据定义语言为:外模式DDL。
③内模式:也称存储模式,是数据物理结构和存储方式的描述,是数据在数据库内部的表示方法,定义所有的内部记录类型、索引和文件的组织方法,以及数据控制方面的细节。描述内模式的数据定义语言为:内模式DDL。
(一个数据库系统中,外模式可以有多个,而模式和内模式只有有一个!!!)
外模式——模式——内模式 分别对应:视图——基本表——文件
2.2 两级映像
首先,数据的独立性是由DBMS的两级映像功能来保证的。
①模式/内模式映像:存在于概念级和内部级之间,实现了模式和内模式之间的相互转换。保证了数据的物理独立性。
②外模式/模式映像:存在于外部级和概念级之间,实现了外模式和模式之间的相互转换。保证了数据的逻辑独立性。
3.数据库设计过程
4.数据模型
4.1E-R模型
在E-R模型中,实体用矩形表示、属性用椭圆形表示、联系用菱形表示。
在上图中学生和课程都是实体,而学号、姓名、性别、年龄这四个是学生实体的属性,课程号、课程名、任何教师这三个是课程实体的属性,因为一个学生可以选修多门课程、一门课程也可以被多个学生选修,所以学生与课程之间是多对多联系,即选课联系用菱形表示,而成绩是选课联系中对应的属性。
4.2关系模型
B,原因待定
**在E-R模型中,每个实体必须转换为一个关系模式,而联系分为(1:1,1:n,m:n)三种,前两种可以转也可以不转,第三种则是必须转。**所以上面这个例题,A、B、C三个实体为多对多对多联系,所以必须转换,即一共可转换为4个关系模式。具体的转换规则如以下三个表所示:👇👇👇
联系类型 | 联系是否转换 | 属性 | 主键 | 外键 |
---|---|---|---|---|
1:1联系 | 转 | 联系自身属性+各实体关键字 | 每个实体的关键字均可作为主键 | 每个实体的关键字均可作为外键 |
不转 | 任意一端实体中添加联系自身属性以及另一端实体的关键字 | 仍为原关系模式的主键 | 另一端实体的关键字 |
联系类型 | 联系是否转换 | 属性 | 主键 | 外键 |
---|---|---|---|---|
1:n联系 | 转 | 联系自身属性+各实体关键字 | n端实体的关键字 | 各实体关键字 |
不转 | n端实体添加联系自身属性以及1端实体的关键字 | 仍为原关系模式的主键 | 1端实体的关键字 |
联系类型 | 联系必须转换 | 属性 | 主键 | 外键 |
---|---|---|---|---|
m:n联系 | 转 | 各实体关键字+联系自身属性 | 各实体关键字的组合 | 各实体的关键字 |
5.关系代数
B
7种基本运算
①集合运算符:并、交、差、笛卡儿积。②专门的关系运算符:选择、投影、连接、除。
其中,并、差、笛卡儿积、选择、投影这五种运算是基本的运算。(对于属性列,笛卡儿积不去重,自然连接去重)
D
优化原则待定
6.数据库完整性约束
7.关系型数据库SQL简介
8.关系型数据库的规范化理论
8.1 函数依赖
假设:学号→姓名,表示学号唯一确定一个学生的姓名,也就是说姓名是完全依赖于学号。
假设(学号,课程号)→系名,而根据常识,显然根据一个学生的学号,就已经可以确认这个学生所在系,根本不需要课程号这个属性,所以这就是一个部分函数依赖。
假设:学号→系名,系名→系主任姓名,在这里我们可以直接得出:学号→系主任姓名,所以这就是一个传递函数依赖。
这里还要介绍一下函数依赖的公理系统,设关系模式R(U,F):👇👇👇
①A1自反律:若Y包含于X包含于U,则X→Y为F所蕴涵。
②A2增广律:若X→Y为F所蕴涵,且Z包含于U,则XZ→YZ为F所蕴涵。
③A3传递律:若X→Y,Y→Z为F所蕴涵,则X→Z为F所蕴涵。
④合并规则:若X→Y,X→Z,则X→YZ为F所蕴涵。
⑤伪传递律:若X→Y,WY→Z,则XW→Z为F所蕴涵。
⑥分解规则:若X→Y,Z包含于Y,则X→Z为F所蕴涵。
8.2 求候选关键字
答案是B。注意上图中是B只能到C。
8.3 规范化理论
8.3.1 范式
①1NF(第一范式):若关系模式R的每一个分量都是不可再分的数据项,则关系模式R∈1NF。
②2NF(第二范式):若关系模式R∈1NF,且每一个非主属性完全依赖于码,则关系模式R∈2NF。(换句话说,当1NF消除了非主属性对码的部分函数依赖,则称为2NF)
③3NF(第三范式):若关系模式R(U,F)中不存在这样的码X,属性组Y及非主属性Z(Z不包含于Y)使得X→Y,Y→Z成立,则关系模式R∈3NF。(换句话说,当2NF消除了非主属性对码的传递函数依赖,则称为3NF)
④BCNF(BC范式):关系模式R(U,F)∈1NF,若X→Y且Y不包含于X时,X必含有码,则R∈BCNF。(换句话说,关系模式R中,若每一个决定因素都包含码,则称为BCNF)
一个满足BCNF的关系模式有:①所有非主属性对每一个码都是完全函数依赖。
②所有主属性对每一个不包含它的码也是完全函数依赖。
③没有任何属性完全函数依赖于非码的任何一组属性。
先找入度为0的。
8.5 模式分解
是无损分解
9.数据库的并发控制
D、C
以下了解一下
10.大数据(了解)