第一章 绪论
1.1 数据库系统概述
1.1.1 四个基本概念
数据(Data) |
数据库(Datebase) |
数据库管理系统(DBMS) |
数据库系统(DBS) |
1. 数据(Data)是数据库中存储的基本对象。
2. 数据的含义称为数据的语义,数据与其语义是不可分的。
3. 数据库(Database,简称DB)是长期储存在计算机内、有组织的、可共享的大量数据的集合。
4. 数据库的基本特征
数据按一定的数据模型组织、描述和储存 |
可为各种用户共享 |
冗余度较小 |
数据独立性较高 |
易扩展 |
5. 数据库管理系统 DBMS(DataBase Management System):位于用户与操作系统之间的一层数据管理软件;是基础软件,是一个大型复杂的软件系统。
6. DBMS 的用途:科学地组织和存储数据、高效地获取和维护数据。
7. DBMS 的主要功能:
数据定义功能 | 提供数据定义语言(DDL) |
---|---|
定义数据库中的数据对象 | |
数据组织、存储和管理 | 分类组织、存储和管理各种数据 |
确定组织数据的文件结构和存取方式 | |
实现数据之间的联系 | |
提供多种存取方法提高存取效率 | |
数据操纵功能 | 提供数据操纵语言(DML) |
实现对数据库的基本操作 (查询、插入、删除和修改) | |
数据库的事务管理和运行管理 | 数据库在建立、运行和维护时由DBMS统一管理和控制保证数据的安全性、完整性、多用户对数据的并发使用发生故障后的系统恢复 |
数据库的建立和维护功能(实用程序) | 数据库初始数据装载转换 |
数据库转储 | |
介质故障恢复 | |
数据库的重组织 | |
性能监视分析等 | |
其它功能 | DBMS与网络中其它软件系统的通信 |
两个DBMS系统的数据转换 | |
异构数据库之间的互访和互操作 |
8. 数据库系统(Database System,简称 DBS):在计算机系统中引入数据库后的系统构成;由数据库、数据库管理系统、应用程序、数据库管理员(DBA)构成。
9. DBS
1.1.2 数据管理技术的产生和发展
1. 数据管理:对数据进行分类、组织、编码、存储、检索和维护;数据处理的中心问题。
2. 数据管理技术的发展过程
人工管理阶段(20世纪40年代中--50年代中) |
文件系统阶段(20世纪50年代末--60年代中) |
数据库系统阶段(20世纪60年代末--现在) |
3.数据管理三个阶段的比较
人工管理阶段 | 文件系统阶段 | 数据库系统阶段 | ||
---|---|---|---|---|
背景 | 应用背景 | 科学计算 | 科学计算、数据管理 | 大规模数据管理 |
硬件背景 | 无直接存取存储设备 | 磁盘、磁鼓 | 大容量磁盘、磁盘阵列 | |
软件背景 | 没有操作系统 | 有文件系统 | 有数据库管理系统 | |
处理方式 | 批处理 | 联机实时处理、批处理 | 联机实时处理、分布处理、批处理 | |
特点 | 数据的管理者 | 用户(程序员) | 文件系统 | 数据库管理系统 |
数据面对的对象 | 某一应用程序 | 某一应用 | 现实世界(一个部门、企业、跨国组织等) | |
数据的共享程度 | 无共享,冗余度极大 | 共享性差,冗余度大 | 共享性高,冗余度小 | |
数据的独立性 | 不独立,完全依赖于程序 | 独立性差 | 具有高度的物理独立性和一定的逻辑独立性 | |
数据的结构化 | 无结构 | 记录内有结构、整体无结构 | 整体结构化,用数据模型描述 | |
数据控制能力 | 应用程序自己控制 | 应用程序自己控制 | 由数据库管理系统提供数据安全性、完整性、并发控制和恢复能力 |
4. 数据库系统的特点
数据结构化 | 整体结构化 | 不再仅仅针对某一个应用,而是面向全组织 |
---|---|---|
不仅数据内部结构化,整体是结构化的,数据之间具有联系 | ||
数据库中实现的是数据的真正结构化 | 数据的结构用数据模型描述,无需程序定义和解释 | |
数据可以变长 | ||
数据的最小存取单位是数据项 | ||
数据的共享性高,冗余度低,易扩充 | 数据库系统从整体角度看待和描述数据,数据面向整个系统,可以被多个用户、多个应用共享使用。 | |
数据独立性高 | 物理独立性 | 指用户的应用程序与存储在磁盘上的数据库中数据是相互独立的。当数据的物理存储改变了,应用程序不用改变。 |
逻辑独立性 | 指用户的应用程序与数据库的逻辑结构是相互独立的。数据的逻辑结构改变了,用户程序也可以不变。 | |
数据独立性是由DBMS的二级映像功能来保证的 | ||
数据由DBMS统一管理和控制 | DBMS提供的数据控制功能 | 数据的安全性(Security)保护 |
数据的完整性(Integrity)检查 | ||
并发(Concurrency)控制 | ||
数据库恢复(Recovery) |
1.2 数据模型
1. 数据模型是对现实世界数据特征的抽象。
2. 在数据库中用数据模型这个工具来抽象、表示和处理现实世界中的数据和信息。
3.数据模型应满足三方面要求:能比较真实地模拟现实世界;容易为人所理解;便于在计算机上实现。
1.2.1 两类数据类型
1. 两类数据模型
概念模型(信息模型) | 按用户的观点来对数据和信息建模,用于数据库设计。 |
---|---|
逻辑模型和物理模型 | 逻辑模型是按计算机系统的观点对数据建模,用于DBMS实现,主要包括网状模型、层次模型、关系模型、面向对象模型等。 |
物理模型是对数据最底层的抽象,描述数据在系统内部的表示方式和存取方法,在磁盘或磁带上的存储方式和存取方法。 |
2. 客观对象的抽象过程---两步抽象
1 | 把现实世界中的客观对象抽象为概念模型 |
2 | 把概念模型转换为某一DBMS支持的数据模型 |
1.2.2 概念模型
1. 基本概念
实体(Entity) | 客观存在并可相互区别的事物称为实体。可以是具体的人、事、物或抽象的概念。 |
---|---|
属性(Attribute) | 实体所具有的某一特性称为属性。一个实体可以由若干个属性来刻画。 |
码(Key) | 唯一标识实体的属性集称为码。 |
域(Domain) | 属性的取值范围称为该属性的域。 |
实体型(Entity Type) | 用实体名及其属性名集合来抽象和刻画同类实体称为实体型。如学生(学号,姓名,性别,年龄,系)。 |
实体集(Entity Set) | 同一类型实体的集合称为实体集 |
联系(Relationship) | 现实世界中事物内部以及事物之间的联系在信息世界中反映为实体内部的联系和实体之间的联系。 |
实体内部的联系通常是指组成实体的各属性之间的联系 | |
实体之间的联系通常是指不同实体集之间的联系 |
2. 两个实体型之间的联系
一对一 |
一对多 |
多对多 |
3. 实体-联系方法( E-R 方法):用 E-R 图来描述现实世界的概念模型。
1.2.3 数据模型的组成要素
数据结构 |
数据操作 |
完整性约束条件 |
1. 数据结构
定义 | 描述数据库的组成对象,以及对象之间的联系 |
描述的内容 | 与数据类型、内容、性质有关的对象 |
与数据之间联系有关的对象 | |
数据结构是对系统静态特性的描述 |
2. 数据操作
定义 | 对数据库中各种对象(型)的实例(值)允许执行的操作及有关的操作规则 |
数据操作的类型 | 查询 |
更新(包括插入、删除、修改) | |
数据操作是对系统动态特性的描述 |
3. 数据的完整性约束条件
一组完整性规则的集合。 | |
完整性规则:给定的数据模型中数据及其联系所具有的制约和依存规则 | |
用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。 | |
数据模型对完整性约束条件的定义 | 反映和规定本数据模型必须遵守的基本的通用的完整性约束条件。例如在关系模型中,任何关系必须满足实体完整性和参照完整性两个条件。 |
提供定义完整性约束条件的机制,以反映具体应用所涉及的数据必须遵守的特定的语义约束条件。 |
1.2.4 常用的数据类型
格式化模型 | 层次模型 (Hierarchical Model) |
网状模型 (Network Model) | |
关系模型 (Relational Model) | |
面向对象模型 (Object Oriented Model) | |
对象关系模型 (Object Relational Model) |
1.2.5 层次模型
1. 层次模型用树形结构来表示各类实体以及实体间的联系
2. 满足下面两个条件的基本层次联系的集合为层次模型:
有且只有一个结点没有双亲结点,这个结点称为根结点 |
根以外的其它结点有且只有一个双亲结点 |
3.示例:
1.2.6 网状模型
1. 满足下面两个条件的基本层次联系的集合为网状模型:
允许一个以上的结点无双亲 |
一个结点可以有多于一个的双亲 |
2.网状模型中子女结点与双亲结点的联系可以不唯一;要为每个联系命名,并指出与该联系有关的双亲记录和子女记录
1.2.7 关系模型
1. 在用户观点下,关系模型中数据的逻辑结构是一张二维表,它由行和列组成。
2. 关系数据模型的数据结构的组成部分
关系(Relation) | 一个关系对应通常说的一张表 |
---|---|
元组(Tuple) | 表中的一行即为一个元组 |
属性(Attribute) | 表中的一列即为一个属性,给每一个属性起一个名称即属性名 |
码(Key) | 表中的某个属性组,它可以唯一确定一个元组。 |
域(Domain) | 属性的取值范围。 |
分量 | 元组中的一个属性值。 |
关系模式 | 对关系的描述 关系名(属性1,属性2,…,属性n) 例:学生(学号,姓名,年龄,性别,系,年级) |
3. 关系必须是规范化的,满足一定的规范条件。
最基本的规范条件:关系的每一个分量必须是一个不可分的数据项,不允许表中还有表。
4. 关系与一般表格的术语对比
关系术语 | 一般表格的术语 |
---|---|
关系名 | 表名 |
关系模式 | 表头(表格的描述) |
关系 | (一张)二维表 |
元组 | 记录或行 |
属性 | 列 |
属性名 | 列名 |
属性值 | 列值 |
分量 | 一条记录中的一个列值 |
非规范关系 | 表中有表(大表中嵌有小表) |
5. 数据操作
数据操作 | 查询 |
插入、删除、更新 | |
数据操作是集合操作,操作对象和操作结果都是关系,即若干元组的集合 |
6. 关系的完整性约束条件
实体完整性 |
参照完整性 |
用户定义的完整性 |
7. 关系数据类型的优缺点
优点 | 建立在严格的数学概念的基础上 | |
---|---|---|
概念单一 | 实体和各类联系都用关系来表示 | |
对数据的检索结果也是关系 | ||
关系模型的存取路径对用户透明 | 具有更高的数据独立性,更好的安全保密性 | |
简化了程序员的工作和数据库开发建立的工作 | ||
缺点 | 存取路径对用户透明导致查询效率往往不如非关系数据模型 | |
为提高性能,必须对用户的查询请求进行优化增加了开发DBMS的难度 |
1.3 数据库系统结构
从数据库管理系统角度看 | 数据库系统通常采用三级模式结构,是数据库系统内部的系统结构 |
---|---|
从数据库最终用户角度看(数据库系统外部的体系结构) ,数据库系统的结构分为: | 单用户结构 |
主从式结构 | |
分布式结构 | |
客户 / 服务器 | |
浏览器/应用服务器/数据库服务器多层结构等 |
1.3.1 数据库系统模式的概念
1. “型”和“值”的概念
型(Type) | 对某一类数据的结构和属性的说明 | (学号,姓名,性别,系别,年龄,籍贯) |
---|---|---|
值(Value) | 是型的一个具体赋值 | (900201,李明,男,计算机,22,江苏) |
2.“模式”和“实例”的概念
模式(Schema) | 数据库中全体数据的逻辑结构和特征的描述 |
---|---|
是型的描述 | |
反映的是数据的结构及其联系 | |
模式是相对稳定的 | |
实例(Instance) | 模式的一个具体值 |
反映数据库某一时刻的状态 | |
同一个模式可以有很多实例 | |
实例随数据库中的数据的更新而变动 |
1.3.2 数据库系统的三级模式结构
1. 数据库系统的三级模式结构
2. 模式(也称逻辑模式)
模式(逻辑模式) | 数据库中全体数据的逻辑结构和特征的描述 |
所有用户的公共数据视图,综合了所有用户的需求 | |
一个数据库只有一个模式 | |
模式的地位:是数据库系统模式结构的中间层 | 与数据的物理存储细节和硬件环境无关 |
与具体的应用程序、开发工具及高级程序设计语言无关 | |
定义模式 | 数据的逻辑结构(数据项的名字、类型、取值范围等) |
数据之间的联系 | |
数据有关的安全性、完整性要求 |
3. 外模式(也称子模式或用户模式)
外模式(也称子模式或用户模式) | 数据库用户(包括应用程序员和最终用户)使用的局部数据的逻辑结构和特征的描述 | ||
---|---|---|---|
数据库用户的数据视图,是与某一应用有关的数据的逻辑表示 | |||
外模式的地位:介于模式与应用之间 | 模式与外模式的关系 | 一对多外模式通常是模式的子集 | |
一个数据库可以有多个外模式。反映了不同的用户的应用需求、看待数据的方式、对数据保密的要求 | |||
对模式中同一数据,在外模式中的结构、类型、长度、保密级别等都可以不同 | |||
外模式与应用的关系:一对多 | 同一外模式也可以为某一用户的多个应用系统所使用 | ||
但一个应用程序只能使用一个外模式 | |||
外模式的用途 | 每个用户只能看见和访问所对应的外模式中的数据 | ||
保证数据库安全性的一个有力措施 |
4. 内模式(也称存储模式)
内模式(也称存储模式) | 是数据物理结构和存储方式的描述 | |
是数据在数据库内部的表示方式 | 记录的存储方式 | |
索引的组织方式 | ||
数据是否压缩存储 | ||
数据是否加密 | ||
数据存储记录结构的规定 | ||
一个数据库只有一个内模式 |
1.3.3 数据库的二级映像功能与数据独立性
三级模式是对数据的三个抽象级别 | |
二级映象在DBMS内部实现这三个抽象层次的联系和转换 | 外模式/模式映像 |
模式/内模式映像 |
1. 外模式 / 模式映像
模式:描述的是数据的全局逻辑结构 | |
外模式:描述的是数据的局部逻辑结构 | |
保证数据的逻辑独立性 | 当模式改变时,数据库管理员修改有关的外模式/模式映象,使外模式保持不变 |
应用程序是依据数据的外模式编写的,从而应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性。 |
2. 模式 / 内模式映像
模式/内模式映象定义了数据全局逻辑结构与存储结构之间的对应关系。 | |
数据库中模式/内模式映象是唯一的 | |
该映象定义通常包含在模式描述中 | |
保证数据的物理独立性 | 当数据库的存储结构改变了(例如选用了另一种存储结构),数据库管理员修改模式/内模式映象,使模式保持不变 |
应用程序不受影响。保证了数据与程序的物理独立性,简称数据的物理独立性。 |
3. 汇总
数据库模式 | 是数据库的中心与关键 |
---|---|
独立于数据库的其他层次 | |
设计数据库模式结构时应首先确定数据库的逻辑模式 | |
数据库的内模式 | 依赖于数据库的全局逻辑结构 |
独立于数据库的用户视图,即外模式 | |
独立于具体的存储设备 | |
将全局逻辑结构中所定义的数据结构及其联系按照一定的物理存储策略进行组织,以达到较好的时间与空间效率 | |
数据库的内模式 | 面向具体的应用程序 |
定义在逻辑模式之上 | |
独立于存储模式和存储设备 | |
当应用需求发生较大变化,相应外模式不能满足其视图要求时,该外模式就得做相应改动 | |
特定的应用程序 | 在外模式描述的数据结构上编写 |
依赖于特定的外模式 | |
与数据库的模式和存储结构独立 | |
不同的应用程序有时可以共用同一个外模式 | |
数据库的二级映像 | 保证了数据库外模式的稳定性 |
从底层保证了应用程序的稳定性,除非应用需求本身发生变化,否则应用程序一般不需要修改 |
1.4 数据库系统的组成
数据库 |
数据库管理系统(及其开发工具) |
应用系统 |
数据库管理员 |
1. 数据库系统对硬件资源的要求
足够大的内存 | 操作系统、DBMS的核心模块、数据缓冲区、应用程序 | |
足够大的外存 | 磁盘或磁盘阵列 | 数据库 |
光盘、磁带 | 数据备份 | |
较高的通道能力,提高数据传送率 |
2. 软件
DBMS |
支持DBMS运行的操作系统 |
与数据库接口的高级语言及其编译系统 |
以DBMS为核心的应用开发工具 |
为特定应用环境开发的数据库应用系统 |
3.人员
数据库管理员(DBA) | 决定数据库中的信息内容和结构 | |
---|---|---|
决定数据库的存储结构和存取策略 | ||
定义数据的安全性要求和完整性约束条件 | ||
监控数据库的使用和运行 | ||
数据库的改进和重组 | ||
系统分析员和数据库设计人员 | 系统分析员 | 负责应用系统的需求分析和规范说明 |
与用户及DBA协商,确定系统的硬软件配置 | ||
参与数据库系统的概要设计 | ||
数据库设计人员 | 参加用户需求调查和系统分析 | |
确定数据库中的数据 | ||
设计数据库各级模式 | ||
应用程序员 | 设计和编写应用系统的程序模块 | |
进行调试和安装 | ||
用户 | 用户是指最终用户(End User)。最终用户通过应用系统的用户接口使用数据库。 |
1.5 小结
数据库系统概述 | 数据库的基本概念 |
---|---|
数据库系统特点 | |
数据模型 | 数据模型的三要素 |
概念模型,E-R 模型 | |
三种主要数据库模型 | |
数据库系统的结构 | 数据库系统三级模式结构 |
数据库系统两层映像系统结构 | |
数据库系统的组成 |