数据库术语与概念详解
1. 数据库基础概念
1.1 基本定义
- 数据库(Database) :是数据以及这些数据之间关系的集合。
- 数据库管理员(Database Administrator,DBA) :负责维护数据库的人员。
- 数据库管理系统(Database Management System,DBMS) :用于管理数据库中数据存储和检索的软件。
1.2 数据模型
- 关系数据模型(Relational Data Model) :将实体表示为表,实体之间的关系通过匹配数据来表示。
- 层次数据模型(Hierarchical Data Model) :所有关系为一对多或一对一,“多”端的实体只能与“一”端的一个实体相关。
- 复杂网络数据模型(Complex Network Data Model) :允许直接的多对多关系以及一对多和一对一关系。
1.3 实体与关系
- 实体(Entity) :我们存储数据的对象。
- 实体标识符(Entity Identifier) :唯一标识数据库中每个实体实例的值或值的组合。
- 关系(Relation) :二维表的定义,列和行的交点处最多只有一个值。
1.4 数据字典与约束
- 数据字典(Data Dictionary) :描述数据库中存储的数据以及数据关系定义的存储库。
- 约束(Constraint) :数据库中数据必须遵循的规则,如实体完整性、参照完整性等。
2. 数据库操作与技术
2.1 数据操作
- 插入(Insertion) :将数据添加到数据库中,但可能存在插入异常,即完整主键的数据不全时无法存储数据。
- 删除(Deletion) :从数据库中移除数据,可能会出现删除异常,删除某实体数据导致主键部分为空,需删除整行。
- 更新(Update) :修改数据库中的数据,可能会出现更新异常,重复数据修改不一致。
2.2 并发控制
- 并发使用(Concurrent Use) :多个用户同时使用同一个数据库。
- 并发控制(Concurrency Control) :确保数据库在并发使用时保持一致性和准确性的机制,如锁机制、时间戳机制等。
2.3 数据建模
- 维度建模(Dimensional Modeling) :数据仓库中最常用的数据模型。
- 事实表(Fact Table) :用于维度建模,包含可汇总的事实。
- 维度表(Dimension Table) :数据仓库中包含用于分组事实表中数据的描述性信息的表。
2.4 数据库优化
- 聚类(Clustering) :将外键行物理存储在其引用的主键行附近,以提高数据库性能。
- 水平分区(Horizontal Portioning) :将表的行拆分到多个具有相同结构的表中,以提高性能。
- 垂直分区(Vertical Partitioning) :将关系存储为原关系的投影的两个或多个表,以提高性能。
3. 数据库安全与攻击
3.1 安全机制
- 防火墙(Firewall) :过滤进出网络流量,阻止违反允许流量规则的消息。
- 授权矩阵(Authorization Matrix) :数据库系统表,包含哪些用户可以访问数据库哪些部分的信息。
- IPSec :虚拟专用网络使用的一种安全类型。
3.2 攻击类型
- 拒绝服务攻击(Denial of Service Attack) :试图阻止合法用户访问网络资源和相关数据库。
- SQL注入攻击(SQL Injection Attack) :通过包含嵌入式SQL的应用程序对数据库系统发起的攻击。
- 缓冲区溢出攻击(Buffer Overflow Attack) :利用应用程序或系统程序中的编程错误来获取对计算机系统的未授权控制。
3.3 黑客类型
- 黑帽黑客(Black Hat Hackers) :为了获利或造成损害而入侵计算机系统的黑客。
- 白帽黑客(White Hat Hackers) :入侵计算机系统后向软件所有者或开发者报告漏洞,目的通常是帮助提高系统安全性。
- 脚本小子(Script Kiddies) :使用预编写软件入侵计算机系统的黑客。
4. 数据库开发与设计
4.1 开发方法
- 原型法(Prototyping) :开发者准备系统的模型,根据用户反馈修改原型或开发最终系统,包括进化原型法和抛弃型原型法。
- 结构化设计生命周期(Structured Design Life Cycle) :开发信息系统的经典模型,适用于信息需求明确的环境。
- 螺旋方法(Spiral Methodology) :更正式的原型法,逐步完善系统。
4.2 设计工具
- 计算机辅助软件工程(CASE)工具 :提供软件和数据库建模图的专用工具。
- 统一建模语言(UML) :一种实体关系图绘制风格。
4.3 数据库架构
- 三层架构(Three-Schema Architecture) :逻辑模式在物理模式和用户视图之间提供接口。
- 客户端/服务器架构(Client/Server Architecture) :处理任务在服务器和客户端计算机之间共享。
5. 数据库相关技术
5.1 XML相关
- 可扩展标记语言(XML) :用于指定文本文档中数据结构的平台无关标记语言,用于数据存储和传输。
- XML模式(XML Schema) :指定XML文档结构的无数据文档。
- 符合解析器(Conforming Parser) :读取XML文档以确定其是否格式良好的软件。
5.2 锁机制
- 排他锁(Exclusive Lock) :持有锁的事务对数据库的一部分具有读写的独占权。
- 共享锁(Shared Lock) :一个或多个事务对数据库的一部分具有控制权,防止其他事务修改数据。
- 写锁(Write Lock) :等同于排他锁。
- 读锁(Read Lock) :一个或多个事务对数据库的一部分具有控制权,防止其他事务修改数据。
5.3 其他技术
- 哈希(Hashing) :根据键值确定数据的物理存储位置,以提供快速访问。
- 索引(Index) :数据库中基于键值提供数据逻辑排序的数据结构。
- 插入排序(Indexed Sequential Access Method,ISAM) :一种物理文件存储技术,同时提供基于键的索引以快速访问数据。
以下是一些关键概念的对比表格:
| 概念 | 定义 |
| — | — |
| 实体完整性 | 关系的约束,主键的任何部分都不能为null |
| 参照完整性 | 关系的约束,每个非空外键值必须匹配现有的主键值 |
| 函数依赖 | 关系中两个属性之间的关系,对于第二个属性的每个唯一值,表中只有第一个属性的一个值 |
| 多值依赖 | 函数依赖的一般情况,一个决定因素为两个不相关属性确定一组值 |
下面是一个简单的数据库操作流程的mermaid流程图:
graph LR
A[开始] --> B[用户发起操作]
B --> C{操作类型}
C -->|查询| D[查询优化器确定执行顺序]
C -->|插入| E[检查插入异常]
C -->|更新| F[检查更新异常]
C -->|删除| G[检查删除异常]
D --> H[执行操作]
E --> H
F --> H
G --> H
H --> I[检查并发控制]
I -->|通过| J[操作完成]
I -->|未通过| K[处理并发问题]
K --> H
J --> L[结束]
通过以上内容,我们对数据库的各个方面有了较为全面的了解,包括基本概念、操作技术、安全与攻击、开发设计以及相关技术等。这些知识对于数据库的管理、开发和维护都非常重要。
6. 数据库中的特殊关系与约束
6.1 关系类型
- 一对一关系(One-to-one Relationship) :数据库中两个实体之间的关系,一个实体的每个实例最多与另一个实体的一个实例相关。
- 一对多关系(One-to-many Relationship) :一个实体的一个实例可以与另一个实体的多个实例相关,而第二个实体的每个实例只能与第一个实体的一个实例相关。
- 多对多关系(Many-to-many Relationship) :两个实体之间的关系,每个实体的实例都可以与另一个实体的多个实例相关。通常需要通过复合实体来表示这种关系。
6.2 约束类型
- 域约束(Domain Constraint) :要求属性的所有值都来自指定的域。
- 实体完整性约束(Entity Integrity) :关系的约束条件,规定主键的任何部分都不能为 null。
- 参照完整性约束(Referential Integrity) :关系的约束,确保每个非空外键值必须匹配现有的主键值。
6.3 特殊关系示例
| 关系类型 | 示例 |
|---|---|
| 一对一关系 | 一个人对应一个身份证号码 |
| 一对多关系 | 一个部门有多个员工 |
| 多对多关系 | 学生和课程,一个学生可以选多门课程,一门课程可以有多个学生选 |
7. 数据库事务处理
7.1 事务概念
- 事务(Transaction) :是对数据库执行的一组操作,要么全部成功执行,要么全部不执行。
- 提交事务(Commit) :使事务的更改永久生效,结束事务。
- 回滚事务(Roll Back) :撤销事务的更改,将数据库恢复到事务开始前的状态。
7.2 事务问题
- 脏读(Dirty Read) :一个事务读取了另一个未提交的更新事务修改的数据,而该更新事务后来被回滚。
- 不可重复读(Nonrepeatable Read) :一个事务两次读取同一数据,发现数据不一致。
- 幻读(Phantom Read) :一个事务第二次读取数据时,发现有新的行被其他事务插入。
7.3 事务并发控制方法
- 两阶段锁(Two-phase Locking) :事务开始时先获取共享/读锁,准备修改数据时升级为排他/写锁。
- 乐观锁(Optimistic Locking) :允许所有修改,若其他事务已修改数据则回滚事务。
- 多版本并发控制(Multiversion Concurrency Control) :数据的检索和修改标记时间,若没有其他事务持有更早的时间戳则允许修改。
下面是一个事务处理流程的 mermaid 流程图:
graph LR
A[开始事务] --> B{操作类型}
B -->|查询| C[执行查询]
B -->|更新| D[获取锁]
B -->|插入| D
B -->|删除| D
D --> E[执行操作]
C --> F[检查并发控制]
E --> F
F -->|通过| G[提交事务]
F -->|未通过| H[回滚事务]
G --> I[结束事务]
H --> I
8. 数据库中的数据表示与存储
8.1 数据类型
- 二进制大对象(Binary Large Object,BLOB) :列数据类型,以二进制形式显示文件(文本和/或图形)的内容,DBMS 无法以任何方式搜索或读取。
- 多值属性(Multivalued Attribute) :一个属性可以同时包含多个值。
- 单值属性(Single-valued Attribute) :一个属性在任何给定时间只包含一个值。
8.2 数据存储
- 物理模式(Physical Schema) :数据库的底层物理存储,由 DBMS 管理。
- 页(Page) :计算机(因此也是数据库)一次在磁盘和主内存之间传输的数据块大小。
- 柱面(Cylinder) :硬盘中一组盘片上所有表面的相同磁道。
8.3 数据存储优化
- 哈希(Hashing) :根据键值确定数据的物理存储位置,提供快速访问。
- 索引(Index) :基于键值对数据进行逻辑排序的数据结构,提高查询速度。
9. 数据库开发中的其他要点
9.1 需求分析与设计
- 系统分析(Systems Analysis) :进行需求评估,确定新的或修改后的信息系统应该具备的功能。
- 需求文档(Requirements Document) :系统分析的输出文档,描述新的或修改后的信息系统的信息需求。
9.2 开发方法对比
| 开发方法 | 特点 | 适用场景 |
|---|---|---|
| 原型法(Prototyping) | 开发者准备模型,根据用户反馈修改,包括进化原型法和抛弃型原型法 | 需求不明确,需要快速验证想法 |
| 结构化设计生命周期(Structured Design Life Cycle) | 经典的开发模型,按顺序进行活动 | 信息需求明确的环境 |
| 螺旋方法(Spiral Methodology) | 更正式的原型法,逐步完善系统 | 需要不断迭代优化的项目 |
9.3 数据库相关标准与规范
- CODASYL 数据库(CODASYL Database) :遵循数据系统语言委员会(Committee on Data Systems Languages,CODASYL)数据库标准的数据库。
- SQL 语言 :用于管理关系数据库的标准语言。
10. 总结
数据库领域涵盖了众多的概念、技术和方法。从基本的数据库定义、数据模型,到复杂的事务处理、并发控制,再到数据库的安全防护和开发设计,每个方面都相互关联且至关重要。
理解数据库中的各种关系和约束,如一对一、一对多、多对多关系,以及实体完整性、参照完整性约束,有助于设计出合理的数据结构。掌握事务处理的流程和并发控制方法,能够确保数据库在多用户环境下的一致性和准确性。同时,了解数据的表示和存储方式,以及不同的开发方法和标准规范,对于数据库的管理、开发和维护都具有重要意义。
在实际应用中,我们需要根据具体的需求和场景,灵活运用这些知识,以构建高效、安全、稳定的数据库系统。
超级会员免费看
6769

被折叠的 条评论
为什么被折叠?



