数据库的范式

本文详细介绍了从第一范式到第五范式的概念及应用实例,帮助理解如何通过规范化减少数据冗余。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

转自: http://zjd9961.blog.163.com/blog/static/338929902010410101658578/


用个简单例子复习一下了。

第一范式

定义:如果关系R 中所有属性的值域都是单纯域,那么关系模式R是第一范式的

那么符合第一模式的特点就有

1)有主关键字

2)主键不能为空,

3)主键不能重复,

4)字段不可以再分

例如:

StudyNo   |   Name   |   Sex   |   Contact

20040901      john         Male      Email:kkkk@ee.net,phone:222456

20040901      mary         famale   email:kkk@fff.net phone:123455

以上的表就不符合,第一范式:主键重复(实际中数据库不允许重复的),而且Contact字段可以再分

所以变更为正确的是

StudyNo |   Name   |   Sex   |      Email         |      Phone

20040901     john       Male                   222456

20040902     mary       famale                 123455

 

第二范式:

定义:如果关系模式R是第一范式的,而且关系中每一个非主属性不部分依赖于主键,称R是第二范式的。

所以第二范式的主要任务就是

满足第一范式的前提下,消除部分函数依赖。

StudyNo | Name | Sex |    Email    | Phone | ClassNo| ClassAddress

01        john   Male    222456    200401      A楼2

01        mary famale    123455    200402      A楼3

这个表完全满足于第一范式,

主键由StudyNo和ClassNo组成,这样才能定位到指定行

但是,ClassAddress部分依赖于关键字(ClassNo-〉ClassAddress),

所以要变为两个表

表一

StudyNo | Name | Sex |     Email        | Phone |   ClassNo

      01    john     Male           222456    200401    

      01    mary     famale         123455    200402   

表二

ClassNo | ClassAddress

200401      A楼2

200402      A楼3

第三范式:

满足第二范式的前提下,消除传递依赖。

例:

StudyNo | Name | Sex |    Email    | bounsLevel | bouns

20040901 john   Male        优秀       $1000

20040902 mary   famale       良        $600

这个完全满足了第二范式,但是bounsLevel和bouns存在传递依赖

更改为:

StudyNo   |   Name   |   Sex   |      Email         |      bouunsNo

20040901      john         Male                  1

20040902     mary         famale                 2

bounsNo   |   bounsLevel   |   bouns

1                 优秀                $1000

2                 良                   $600

这里我比较喜欢用bounsNo作为主键,

基于两个原因

1)不要用字符作为主键。可能有人说:如果我的等级一开始就用数值就代替呢?

2)但是如果等级名称更改了,不叫 1,2 ,3或优、良,这样就可以方便更改,所以我一般优先使用与业务无关的字段作为关键字。

 

一般满足前三个范式就可以避免数据冗余。

第四范式:
主要任务:满足第三范式的前提下,消除多值依赖
product   | agent | factory
Car            A1        F1
Bus           A1         F2
Car            A2         F2
在这里,Car的定位,必须由 agent 和 Factory才能得到(所以主键由agent和factory组成),可以通过 product依赖了agent和factory两个属性
所以正确的是
表1                              表2:
product   |   agent            factory |   product
Car            A1                  F1            Car
Bus            A1                  F2            Car
Car            A2                  F2            Bus

第五范式:
定义: 如果关系模式R中的每一个连接依赖, 都是由R的候选键所蕴含, 称R是第五范式的
看到定义,就知道是要消除连接依赖,并且必须保证数据完整
例子
A   |   B |   C
a1      b1   c1
a2      b1   c2
a1      b2   c1
a2      b2   c2
如果要定位到特定行,必须三个属性都为关键字。
所以关系要变为 三个关系,分别是A 和B,B和C ,C和A
如下:
表1          表2         表3
A   |   B             B   |   C          C    |    A
a1      b1            b1      c1         c1      a1          
a1      b2            b1      c2         c1      a2

         范式可以避免数据冗余,减少数据库的空间,减轻维护数据完整性的麻烦,但是操作难,因为需要联系多个表才能得到所需要数据,而且越高范式性能就会越差。要权衡是否使用更高范式是比较麻烦。
      一般我在做项目中都,用得最多的也就是第三范式,我认为使用到第三范式也就足够了,性能好而且方便管理数据。




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值