一. 第一范式
- 每一列都是不可分割的原子数据项(不能再分为更小的项)
例子:
很明显,第三列可以拆分,拆分后为:
上表符合了第一范式
- 存在的问题:
- 存在非常严重的数据冗余(姓名,系名,系主任)
- 数据添加存在问题,添加一个新添加的系,数据不合法,没有学生
- 删除存在问题,张无忌毕业,删除数据,会将系的数据一起删除
二. 第二范式
- 在1NF的基础上,非码属性必须完全依赖于码(在1NF基础上消除非主属性对主码的部分函数依赖)
概念中的各种含义:
-
函数依赖:A–>B,如果通过A属性(属性组)的值,可以确定唯一B属性的值。则称B依赖于A
例如:学号–>姓名。 (学号,课程名称)_属性组 --> 分数 -
完全函数依赖:A–>B, 如果A是一个属性组,则B属性值得确定需要依赖于A属性组中所有的属性值。
例如:(学号,课程名称) --> 分数 -
部分函数依赖:A–>B, 如果A是一个属性组,则B属性值得确定只需要依赖于A属性组中某一些值即可。
例如:(学号,课程名称) – > 姓名 -
传递函数依赖:A–>B, B – >C . 如果通过A属性(属性组)的值,可以确定唯一B属性的值,在通过B属性(属性组)的值可以确定唯一C属性的值,则称 C 传递函数依赖于A
例如:学号–>系名,系名–>系主任 -
码:如果在一张表中,一个属性或属性组,被其他所有属性所完全依赖,则称这个属性(属性组)为该表的码
例如:该表中码为:(学号,课程名称) 通过学号,课程名称可以唯一确定姓名,系名,系主任,分数
* 主属性:码属性组中的所有属性(码的属性)
* 非主属性:除过码属性组的属性(除去码的属性)
对其理解:
- 例子中码属性为学号,课程名称
- 分数完全依赖于学号和课程名称
- 姓名,系名,系主任只依赖于学号,部分依赖于码
消除部分依赖的步骤:
(1)拆分表,首先复制表为表2,然后删除表1中有关部分依赖的元素(姓名,系名,系主任)
(2)所以表1中只有学号,课程名称,分数。其中分数完全依赖于学号和课程名称,即消除了非主属性对主码的部分函数依赖。
(3)在表2的处理,先删除表2中包含表1的俩个元素(表1中有3个元素),删除课程名称和分数,其中码属性为学号,再删除 重复的元素
消除后表为:
存在的问题:
- 数据添加存在问题,添加一个新添加的系,数据不合法,没有学生
- 删除存在问题,张无忌毕业,删除数据,会将系的数据一起删除
三. 第三范式
- 在2NF基础上,任何非主属性不依赖于其它非主属性(在2NF基础上消除传递依赖)
理解:
在第二范式的基础上,学号依赖于系名,系名依赖于系主任,存在传递依赖
消除传递依赖步骤:
继续拆分表,先找出传递依赖项,把表2中有关部分依赖的元素中非主码元素拿出来,新建表3,同时删除表2中有关依赖元素中的其中1个元素,造成表2不在存在传递依赖。再删除表3中重复元素。
拆分后的表: