数据库事务和范式

本文介绍了数据库事务的四大特性:原子性、一致性、隔离性和持久性,并解释了这些特性的含义及其应用场景。此外,还详细阐述了数据库设计中的第一、第二和第三范式,以及如何遵循这些规范来减少数据冗余并提升数据一致性。

数据库事务四大特性:原子性、一致性、分离性、持久性

原子性(Atomicity):一个事务它所做的对数据修改操作要么完整执行,要么完全不执行。

一致性(consistency):在一个事务执行之前和执行之后数据库都必须处于一致性状态。

隔离性(Isolation):对于任何一对事务T1和T2,在事务T1看来,T2要么在T1开始之前执行,要么在T1完成之后才开始执行,这样,每个事务都感觉不到系统中有并发事务执行。

持久性(Durability):一个事务一旦成功完成,它对数据库的改变必须是永久的,即使是在系统遇到故障的情况下也不会丢失,数据的重要性决定了事物的持久性的重要。

 

原 子性:(all or nothing的问题)指一个事务中,包含若干个数据操作,这些操作是一个整体,要么一起完成,要么一起不完成,不能只完成其中的一部分。比如你去银行转 帐,从一个账户转帐到另一个账户,这是一个完整的事务,包括两个操作,从你第一个账户读数,增加到第二个账户,并减去第一个账户中的钱,如果这些操作有一 个失败了,整个事务都必须还原成最开始的状态。
一致性:是指数据库从一个完整的状态跳到另一个完整的状态,是用于保护数据库的完整性的。比如你修 改数据库的某个外键值,如果没有和相应的主键对应,就违反了数据库的一致性。另外,还有读一致性,如:你刚写入一个数到数据库中,但还没有提交,这时候有 人要读这个数,就涉及完整性问题,要保证读取的数据在整个数据库中是处于和其他数据一致的一个状态。

 

*******************************************范式****************************************************************

范式(Normalization)要按照要求使用以提高性能。Normalization做的不够会导致数据冗余,而过度Normalization 会导致太多的join和数据表,这两种情况都会影响性能。

数据库范式:是为了消除重复数据减少冗余数据,从而让数据库内的数据更好的组织,消除了数据冗余、更新异常、插入异常和删除异常(删除某个字段信息后其他属性也被删除),让磁盘空间得到更有效利用的一种标准化标准,满足高等级的范式的先决条件是满足低等级范式。

◆ 第一范式(1NF):强调的是列的原子性,即列不能够再分成其他几列(粒度问题)。
考虑这样一个表:【联系人】(姓名,性别,电话)
如果在实际场景中,一个联系人有家庭电话和公司电话,那么这种表结构设计就没有达到 1NF。要符合 1NF 我们只需把列(电话)拆分,即:【联系人】(姓名,性别,家庭电话,公司电话)。1NF 很好辨别,但是 2NF 和 3NF 就容易搞混淆。


◆ 第二范式(2NF):首先是 1NF,另外包含两部分内容,一是表必须有一个主键;二是没有包含在主键中的列必须完全依赖于主键,而不能只依赖于主键的一部分。
考虑一个订单明细表:【OrderDetail】(OrderID,ProductID,UnitPrice,Discount,Quantity,ProductName)。
因 为我们知道在一个订单中可以订购多种产品,所以单单一个 OrderID 是不足以成为主键的,主键应该是(OrderID,ProductID)。显而易见 Discount(折扣),Quantity(数量)完全依赖(取决)于主键(OderID,ProductID),而 UnitPrice,ProductName 只依赖于 ProductID。所以 OrderDetail 表不符合 2NF。不符合 2NF 的设计容易产生冗余数据。
可以把【OrderDetail】表拆分为【OrderDetail】 (OrderID,ProductID,Discount,Quantity)和【Product】 (ProductID,UnitPrice,ProductName)来消除原订单表中UnitPrice,ProductName多次重复的情况。


◆ 第三范式(3NF):首先是 2NF,另外非主键列必须直接依赖于主键,不能存在传递依赖。即不能存在:非主键列 A 依赖于非主键列 B,非主键列 B 依赖于主键的情况。
考虑一个订单表【Order】(OrderID,OrderDate,CustomerID,CustomerName,CustomerAddr,CustomerCity)主键是(OrderID)。
其 中 OrderDate,CustomerID,CustomerName,CustomerAddr,CustomerCity 等非主键列都完全依赖于主键(OrderID),所以符合 2NF。不过问题是 CustomerName,CustomerAddr,CustomerCity 直接依赖的是 CustomerID(非主键列),而不是直接依赖于主键,它是通过传递才依赖于主键,所以不符合 3NF。
通过拆分【Order】为【Order】(OrderID,OrderDate,CustomerID)和【Customer】(CustomerID,CustomerName,CustomerAddr,CustomerCity)从而达到 3NF。
第二范式(2NF)和第三范式(3NF)的概念很容易混淆,区分它们的关键点在于,2NF:非主键列 是否完全依赖于主键 ,还是依赖于主键的一部分;3NF:非主键列 是直接依赖于主键,还是直接依赖于非主键列

### 数据库范式的概念 数据库范式是指由E.F.Codd提出的关于关系数据库设计的一系列规则标准,这些规则帮助开发者减少数据冗余并增强数据一致性[^3]。通过遵循不同的范式级别(从1NF到更高的形式如5NF),可以逐步优化数据库结构。 #### 第一范式 (1NF) 第一范式要求表中的每一列都必须是原子性的,即不可再分的基本数据项[^1]。这意味着每一条记录都应该是一个单一值而不是一组重复的值或者列表。 #### 第二范式 (2NF) 第二范式建立在第一范式的基础上,进一步规定所有的非主属性完全依赖于整个主键而非其部分组件[^2]。这有助于防止部分函数依赖带来的问题。 #### 第三范式 (3NF) 第三范式是在满足前两者的前提下,消除了任何非主属性对候选关键字之间的传递函数依赖关系[^2]。这样做的目的是为了确保没有间接的数据关联影响整体架构稳定性。 ### 应用场景分析 尽管高阶范式提供了更好的逻辑独立性较少的数据重复率,但在实际项目开发当中并非总是追求最高程度的形式化处理。例如,在某些特定条件下允许一定程度上的去规范化(反范式),以便换取读取速度方面的改进: - **低频写入高频读取环境**:在这种环境中适当引入一些冗余信息可能会显著加快查询响应时间因为减少了必要的联接次数[^4]。 - **实时报表生成系统**:当面对复杂的汇总计算需求时预先聚合结果存储下来也可以有效降低在线事务处理的压力从而提升用户体验质量。 然而需要注意的是过度使用这种方法不仅增加了磁盘占用还容易引发同步错误所以应当谨慎评估利弊后再决定实施策略。 ```sql -- 示例SQL语句展示如何创建符合3NF的关系型表格 CREATE TABLE Orders ( OrderID INT PRIMARY KEY, CustomerID INT NOT NULL, -- 假设Customer有单独一张表 FOREIGN KEY (CustomerID) REFERENCES Customers(CustomerID), OrderDate DATE NOT NULL ); CREATE TABLE OrderDetails ( DetailID INT AUTO_INCREMENT PRIMARY KEY, OrderID INT NOT NULL, ProductID INT NOT NULL, Quantity INT DEFAULT 0 CHECK (Quantity >= 0), Price DECIMAL(8 , 2 ) UNSIGNED , FOREIGN KEY (OrderID) REFERENCES Orders(OrderID), FOREIGN KEY (ProductID) REFERENCES Products(ProductID) ); ``` 以上代码片段展示了两个相互关联但各自保持良好分离度的实体定义方式——订单及其明细条目分别存放在不同地方并通过外键机制维持联系;这样的安排正好体现了良好的实践原则之一就是尽量避免不必要的嵌套复合类型字段存在于此同时又能很好地适应未来扩展可能性变化趋势的要求。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值