数据库(第一范式,第二范式,第三范式)

本文介绍了关系数据库设计中的三大范式:1NF、2NF、3NF的基本概念及应用原则。1NF要求列不可再分;2NF需定义主键且非主键列需完全依赖于整个主键;3NF则进一步要求非主键列直接依赖于主键,避免传递依赖。

 范式:英文名称是 Normal Form,它是英国人 E.F.Codd(关系数据库的老祖宗)在上个世纪70年代提出关系数据库模型后总结出来的,范式是关系数据库理论的基础,也是我们在设计数据库结构过程中所要遵循的规则和指导方法。目前有迹可寻的共有8种范式,依次是:1NF,2NF,3NF,BCNF,4NF,5NF,DKNF,6NF。通常所用到的只是前三个范式,即:第一范式(1NF),第二范式(2NF),第三范式(3NF)。下面就简单介绍下这三个范式。 
◆ 第一范式(1NF):强调的是列的原子性,即列不能够再分成其他几列。 
考虑这样一个表:【联系人】(姓名,性别,电话) 
如果在实际场景中,一个联系人有家庭电话和公司电话,那么这种表结构设计就没有达到 1NF。要符合 1NF 我们只需把列(电话)拆分,即:【联系人】(姓名,性别,家庭电话,公司电话)。1NF 很好辨别,但是 2NF 和 3NF 就容易搞混淆。 
◆ 第二范式(2NF):首先是 1NF,另外包含两部分内容,一是表必须有一个主键;二是没有包含在主键中的列必须完全依赖于主键,而不能只依赖于主键的一部分。 
考虑一个订单明细表:【OrderDetail】(OrderID,ProductID,UnitPrice,Discount,Quantity,ProductName)。 
因为我们知道在一个订单中可以订购多种产品,所以单单一个 OrderID 是不足以成为主键的,主键应该是(OrderID,ProductID)。显而易见 Discount(折扣),Quantity(数量)完全依赖(取决)于主键(OderID,ProductID),而 UnitPrice,ProductName 只依赖于 ProductID。所以 OrderDetail 表不符合 2NF。不符合 2NF 的设计容易产生冗余数据。 
可以把【OrderDetail】表拆分为【OrderDetail】(OrderID,ProductID,Discount,Quantity)和【Product】(ProductID,UnitPrice,ProductName)来消除原订单表中UnitPrice,ProductName多次重复的情况。 
◆ 第三范式(3NF):首先是 2NF,另外非主键列必须直接依赖于主键,不能存在传递依赖。即不能存在:非主键列 A 依赖于非主键列 B,非主键列 B 依赖于主键的情况。 
考虑一个订单表【Order】(OrderID,OrderDate,CustomerID,CustomerName,CustomerAddr,CustomerCity)主键是(OrderID)。 
其中 OrderDate,CustomerID,CustomerName,CustomerAddr,CustomerCity 等非主键列都完全依赖于主键(OrderID),所以符合 2NF。不过问题是 CustomerName,CustomerAddr,CustomerCity 直接依赖的是 CustomerID(非主键列),而不是直接依赖于主键,它是通过传递才依赖于主键,所以不符合 3NF。 
通过拆分【Order】为【Order】(OrderID,OrderDate,CustomerID)和【Customer】(CustomerID,CustomerName,CustomerAddr,CustomerCity)从而达到 3NF。 
第二范式(2NF)和第三范式(3NF)的概念很容易混淆,区分它们的关键点在于,2NF:非主键列是否完全依赖于主键,还是依赖于主键的一部分;3NF:非主键列是直接依赖于主键,还是直接依赖于非主键列。

### 数据库规范化理论中的第一、第二和第三范式的定义与区别 数据库规范化是一种设计数据库表结构的方法,旨在减少数据冗余、提高数据一致性和维护性。规范化理论通过一系列的范式(Normal Form)来定义不同层次的设计标准。第一范式(1NF)、第二范式(2NF)和第三范式(3NF)是规范化过程中最基本的三个范式,它们各自有不同的要求和目标。 #### 第一范式(1NF) 第一范式是最基础的规范化形式,它要求数据库表中的每个字段都必须是**原子的**,即不可再分。换句话说,每个字段的值只能包含单一的数据项,不能包含重复的组或列表。通过满足第一范式,可以消除数据冗余和重复数据的问题。 例如,一个不符合第一范式的表可能包含一个字段“电话号码”,其中存储了多个电话号码,用逗号分隔。这种设计会导致查询和更新操作变得复杂且容易出错。为了符合第一范式,应该将“电话号码”拆分为多个单独的字段或使用关联表来存储多个电话号码。 #### 第二范式(2NF) 第二范式建立在第一范式的基础之上,它要求表中的所有非主键字段必须**完全依赖于主键**,而不是部分依赖于主键。在存在复合主键的情况下,如果某个非主键字段只依赖于主键的一部分,则该表不符合第二范式。 例如,假设有一个订单明细表,主键由“订单ID”和“产品ID”组成,而“产品名称”字段仅依赖于“产品ID”,而不依赖于“订单ID”。这种部分依赖会导致数据冗余和更新异常。为了符合第二范式,应该将“产品名称”移到另一个与“产品ID”相关联的表中。 #### 第三范式(3NF) 第三范式进一步强化了规范化的要求,它要求表中的所有非主键字段不能依赖于其他非主键字段。换句话说,表中的每个非主键字段必须直接依赖于主键,而不是间接依赖于其他非主键字段。这种要求可以进一步减少数据冗余,并提高数据一致性。 例如,假设有一个员工表,其中包含“部门ID”、“部门名称”和“员工姓名”。如果“部门名称”依赖于“部门ID”,而“员工姓名”依赖于“部门名称”,则该表不符合第三范式。为了符合第三范式,应该将“部门名称”移到另一个与“部门ID”相关联的表中。 ### 区别 - **第一范式**主要关注字段的原子性,确保每个字段都是不可再分的。 - **第二范式**在第一范式的基础上,解决了部分依赖的问题,确保非主键字段完全依赖于主键。 - **第三范式**在第二范式的基础上,解决了传递依赖的问题,确保非主键字段不依赖于其他非主键字段。 通过逐步应用这些范式,可以逐步优化数据库设计,减少数据冗余,提高数据一致性和维护性。三大范式共同构建了高效、稳定且易于维护的数据结构,是数据库设计的重要基石[^2]。 ```python # 示例代码:检查表是否符合第三范式 def check_3nf(table): # 假设 table 是一个字典,其中键是列名,值是该列的依赖关系 dependencies = table.get('dependencies', {}) primary_key = table.get('primary_key', []) for column, dependent_columns in dependencies.items(): if column not in primary_key: # 检查是否存在非主键字段依赖于其他非主键字段 for dep in dependent_columns: if dep not in primary_key and dep != column: return False return True # 示例表结构 table = { 'columns': ['employee_id', 'name', 'department_id', 'department_name'], 'primary_key': ['employee_id'], 'dependencies': { 'name': ['employee_id'], 'department_id': ['employee_id'], 'department_name': ['department_id'] } } # 检查是否符合第三范式 is_3nf = check_3nf(table) print(f"表是否符合第三范式: {is_3nf}") ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值