数据库部分内容备考笔记
声明:部分截图为希塞公开课截图而来。
一、数据库的基本概念
1. 数据库体系结构
(1) 集中式数据库系统
- 数据是集中的
- 数据管理是集中的
- 数据库的素有功能都集中在DSNS所在的计算机
(2) C/S结构
C:客户端 S:服务器 → B/S:B浏览器
- 客户端负责数据表示
- 服务器:数据库服务
- 数据库系统分为前端和后端
- ODBC、JDBC(中间件)
(3) 分布式数据库
- 物理上分布、逻辑上集中
- 物理上分布、逻辑上分布
- 特点
- 数据独立性:除了数据的逻辑独立性和物理独立性外,还有分布独立性(分布透明性)
- 集中与自治共享结合的控制结构:各局部的DBMS可以独立地管理局部数据库,具有自治的功能。同时,系统又设有集中控制机制,协调各局部DBMS的工作,执行全局应用。
- 适当增加数据冗余度:在不同的场地存储同一数据的多个副本,可以提高系统的可靠性和可用性,同时也能提高系统性能。(提高系统的可用性,即当系统中某个节点发生故障时,因为数据有其他副本在非故障场地上,对其他所有场地来说,数据仍然是可用的,从而保证数据的完备性。)
- 全局的一致性、可串行性和可恢复性 .
- 透明性
- 分片透明:是指用户不必关心数据是如何分片的,它们对数据的操作在全局关系上进行,即如何分片对用户是透明的。
- 复制透明:用户不用关心数据库在网络中各个节点的复制情况,被复制的数据的更新都由系统自动完成。
- 位置透明:是指用户不必知道所操作的数据放在何处,即数据分配到哪个或哪些站点存储对用户是透明的。
- 局部映像透明性(逻辑透明):是最低层次的透明性,该透明性提供数据到局部数据库的映像,即用户不必关心局部DBMS支持哪种数据模型使用哪种数据操纵语言,数据模型和操纵语言的转换是由系统完成的。因此,局部映像透明性对异构型和同构异质的分布式数据库系统是非常重要的。
(4) 并行数据库
- 共享内存式
- 无共享式
2. 三级模式结构
三级模式和两级映像
外模式:用户模式
内模式:存储模式
外模式-概念模式映射:逻辑独立性
概念模式-内模式映射:物理独立性
3. 数据仓库
特点:
- 面向主题:数据按主题组织。 b.集成的:消除了源数据中的不一致性,提供整个企业的一致性全局信息。
- 相对稳定的(非易失的):主要进行查询操作,只有少量的修改和删除操作(或不删除)。
- 反映历史变化(随着时间变化):记录了企业过去某一时刻到当前各个阶段的信息,可对发展历程和未来趋势做定量分析和预测。
过程:
- 数据预处理 / 数据清洗(ETL):抽取、清理、装载、刷新
- 数据仓库存储
- 数据分析
- 数据展现
OLAP:数据仓库(A:分析):联机分析系统
OLTP:数据库:联机事务系统
二、数据库设计过程
E-R模型
1. 概念结构设计
(1) 概念设计过程
E-R模型
- 集成的方法
- 多个局部E-R图一次集成
- 逐步集成,用累加的方式一次集成2个局部E-R
- 集成产生的冲突及解决办法(针对同一对象)
- 属性冲突:包括属性域冲突和属性取值冲突。
- 命名冲突:包括同名异义和异名同义。
- 结构冲突:包括同一对象在不同应用中具有不同的抽象,以及同一实体在不同局部E-R图中所包含的属性个数和属性排列次序不完全相同。
(2) E-R图
例如:
【矩形】:【实体】 , 【椭圆形】:【属性】 , 【菱形】:【联系】, 【线条+圈,矩形+平行线】:【特殊化】
实体:实体是现实世界中可以区别于其他对象的事件或事物。(实体集:实体的集合)
属性:属性是实体某方面的特性。
联系:实体的联系分为实体内部的联系和实体与实体间的联系。实体间联系模型:1对1,1对多,多对多。
- 属性
- 简单属性:是原子的,不可再分的。
- 复合属性:可以细分为更小的部分(即划分为别的属性)。
- 单值属性:定义的属性对于一个特定的实体都只有单独的一个值。
- 多值属性:在某些特定情况下,一个属性可能对应一组值。
- NULL属性:表示无意义或不知道。
- 派生属性:可以从其他属性得来。
- 两个不同实体集之间的联系