【系统分析师之路】系统分析师必知必会(数据库中篇)

原创已于 2022-05-07 07:50:31 修改 · 515 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#软考系分

于 2022-05-07 07:42:23 首次发布

系统分析师---必知必会专栏收录该内容

23 篇文章

订阅专栏

本文深入探讨了系统分析师在数据库领域的核心知识，包括关系代数的各种运算，如笛卡尔积、自然连接和投影等，以及数据库的三级模式和两级映射。此外，还详细阐述了数据库设计的各个阶段，如需求分析、概念结构设计、逻辑结构设计和物理设计，强调了数据备份的重要性和不同类型，以及数据库安全技术和优化策略。

【系统分析师之路】系统分析师必知必会(数据库中篇)

系统分析师必知必会数据库中篇

- 【系统分析师之路】系统分析师必知必会(数据库中篇)

九. 关系代数

1. 笛卡尔积

R（A，B，C，D）✖️S（C，D，E）得到的是7元关系，即逐个用R中的每一条数据，与S中的每一条数据直接拼接起来。如果R中有r条记录，S中有s条记录，那么R✖️S中就有r*s条数据。

2. 自然连接

它是一种特殊的等值连接，它要求在两个关系中进行比较的分量必须是相同的属性组，并且在结果中把重复的属性列去掉重复的属性列。
在连接的基础上，S1和S2都有的字段做等值操作。

3. 等值连接

它是关系运算-连接运算的一种常用的连接方式。
在SQL角度来看，等值连接是在where子句中使用等号进行连接运算。

4. 非等值连接

在SQL角度来看，非等值连接是在where子句中使用等号以外的运算符进行连接运算。

5. 自连接

自己和自己做笛卡尔积

6. 投影

投影是对R关系的列的映射；它是一种选列的操作

7. 选择

是对行的映射，选择满足关系条件的行。它选择的是记录，选择的是行。

8. 等值连接和自然连接的区别

等值连接不要求相等的属性值的属性名相同，而自然连接要求相等属性值的属性名必须相同，即两个关系只有在同名属性才能进行自然连接。
等值连接不将重复属性去掉，而自然连接去掉重复属性，也可以说，自然连接是去掉重复列的等值连接。

9. 关系代数基础

并：两个关系表合并掉，并且去掉重复列。
交：两个关系表的公共部分
差：把S1当中的S1和S2的公共部分给去掉。
连接：S1和S2都有的字段只保留一个。

十. 三级模式两级映射

三级模式：外模式，模式，内模式
二级映射：外模式与模式的映射，模式与内模式的映射。

1）外模式

外模式也叫做用户模式，是数据库用户能看见和使用的局部数据的逻辑结构，与某一应用有关的数据逻辑表示，外模式通常是模式的子集，一个数据库有多个外模式，外模式是概念结构设计阶段的产物，它的输出就是ER图。

2）模式

也称为逻辑模式，它是数据库中全体数据的逻辑结构和特征的描述，所有用户的公共数据视图，模式实际上是数据库数据在逻辑集上的视图。
一个数据库只有一个模式，逻辑结构设计阶段的产物是表结构。

3）内模式

也叫做存储模式，一个数据库只有一个内模式，它是对数据的物理结构和存储方式的描述，它是数据在数据库内部的表示方式，它是物理设计阶段产物。
索引的写入修改了数据库的物理结构，而不是简单的逻辑设计。内模式规定了数据在存储介质上的物理组织方式、记录寻址方式。
如果对数据库中的表创建聚簇索引，那么改变的是数据库的内模式。

4）物理独立性

当内模式发生改变时，数据的逻辑结构保持不变，只需要修改模式与内模式之间的映射。

5）逻辑独立性

数据的逻辑结构发生变化，应用程序不用修改，只需要修改外模式与模式之间的映射。

十一. 数据库设计

1）需求分析

得到数据要求和处理要求。使用数据流图描述业务流程。
对现实世界要处理的对象（组织、部门、企业等）进行详细调查，在了解现行系统的概况，确定新系统功能的过程中，确定系统边界、收集支持系统目标的基础数据及其处理方法。

2）概念结构设计

1. 概念定义

它也称为概念结构设计，其任务是在需求分析阶段产生的需求说明是的基础上，按照特定的方法将它们抽象为一个不依赖于任何DBMS的数据模型，即概念模型。
概念结构设计阶段是在需求分析的基础上，对用户信息加以分类、聚集和概括，建立信息模型

2. 特点

与DBMS无关，它对应的是“外模式”。
概念模型的表示形式就是ER模型和数据字典。

3. 工作步骤

抽象数据→设计局部视图→合并取消冲突→修改重构消除冗余

3）逻辑结构设计

1. 概念定义

将概念结构模型转换成一般的关系。其主要任务是将概念模型转换为某个特定的DBMS上的逻辑模型。
也就是将ER图转换成表结构，网状，层次模型，然后再向特定的DBMSe支持下的数据模型转换，最后对数据模型进行优化（模式的分解，合并，增加部分必要的冗余）逻辑结构设计与具体的DBMS是有关的，
关系规范化是在数据库设计的逻辑阶段进行。

2. 特点

对应三级模式中的“模式”。
选定的DBMS，转换成为数据的逻辑模式，对关系模式进一步地规范化处理。

3. 工作步骤

转换为数据模型一关系规范化一模式优化一设计用户模式

4）物理设计

其任务是对给定的逻辑模型选取一个最适合应用环境的物理结构。
基于具体数据库设计实现，包括了文件结构，索引等。它对应的是三级模式中的内模式，也就是存储模式。
所谓数据库的物理结构，主要是数据库在物理设备上的存储结构和存取方法。

十二. 数据库备份

数据库备份分为了冷备份，热备份和数据导出。

1）数据导出

根据数据导出的范围又分为：完全导出，增量导出，累计导出。
增量导出：只导出上一次导出的基础上把变化的数据导出。
累计导出：在上一次完全导出的基础上，把变化的所有数据都导出来。

2）导出备份

导出备份是一种逻辑备份，而冷备份和热备份是物理备份。

3）冷备份

冷备份是在数据库关闭的情况下，对数据库中的关键文件（数据文件日志文件）进行复制。

No	冷备份优点	冷备份缺点
01	快速简单，维护方便	冷备份时数据库关闭，不能同时做其他的工作
02	可以恢复到备份的时间点上	单独使用时，只能恢复到备份时的时间点上
03	如果和热备份结合，可以实现秒级恢复	不能按数据库中某个表或者是某个用户来进行备份
04	低度维护，高度安全	拷贝到磁盘等其他外部存储设备上，速度会很慢

4）热备份

数据库在运行当中对数据库关键数据进行备份，要求数据库管理系统提供支持。

No	热备份优点	热备份缺点
01	备份时数据库仍然可用	如果热备份出错，所得结果不能用于时间点恢复
02	可以实现秒级恢复	不能出错，否则会引起数据库无法恢复
03	可在表空间或数据文件集备份，备份时间短	维护比较困难

5）系统容灾

在灾难发生时，保证系统业务持续不间断运行的能力。它包括了数据容灾和应用容灾两个方面。

1. 数据容灾

数据容灾包括了数据备份技术，数据复制技术，数据管理技术；

2. 应用容灾

应用容灾包括了灾难检测技术，系统迁移技术，系统恢复技术。

6）常用备份技术

数据转储和建立日志文件两种。

1. 数据转储的定义

定期把整个数据库复制到另一个介质保存的过程。转储十分耗资源，不能频繁进行。

2. 数据转储分类

可以分为静态转储和动态转储两种。
换个维度也可以分为海量转储和增量转储两种。

No	存储类型	说明
01	静态海量转储	在无事物运行时进行，每次转储的是全部数据库
02	动态海量转储	允许事务运行，每次转储全部的数据库；加上日志才能进行恢复
03	静态增量转储	无运行事务时进行，每次转储的是更新部分的数据
04	动态增量转储	允许事务运行，每次转储更新部分的数据

3. 日志文件

建立过程
事务在运行时，系统把每个操作严格按执行时间次序作为记录存放到日志文件。
作用
进行事务故障恢复和系统故障恢复，协助后备副本进行介质恢复。
利用恢复事务过程
扫描日志文件，哪些日志在故障发生时已经结束，哪些未结束，对尚未结束的事务，进行撤销处理（Undo），对已经结束的事务进行重做（Redo），以保证数据的一致性。

十三. 关系表属性类型

简单类型：原子的不可再分
单值属性：对于特定的实体都只有单独的一个值
多值属性：如果某个属性可能有多重取值，则这样的属性称为多重属性，比如联系方式和兴趣爱好。
多重属性一般抽取为独立的实体（属性值，实体，ID）。
复合属性：可以细分更小的部分，可以划分为多个属性。例如，通信地址可以划分为邮编，省市地址，街道等。
派生属性：可以从一个相关属性和属性集的值派生得到的属性。这个属性在实体中不是必须的，比如年龄可以从生日中派生得到。