数据库笔记之基本概念
数据库技术是专门研究如何科学的组织和存储数据、如何高效的获取和处理数据的技术。我们在学习数据库之前,应该了解一下它所涉及到的基本概念。
信息、数据、数据处理与数据管理
- 信息:是人脑对现实世界事物的存在方式、运动状态以及事物之间联系的抽象反映。其特征是:①信息源于物质和能量;②信息是可以感知的;③信息是可以存储、加工、传递和再生的。
- 数据:是由用来记录信息的可识别的符号组合,是信息的具体表现形式。
数据和信息的联系: 数据是信息的符号表示或者载体,信息则是数据的内涵。 - 数据处理:是将数据转为信息的过程,包括对数据的收集、管理、加工利用等。
- 数据管理:指数据的收集、分类、组织、编码、存储等操作。
数据库系统阶段管理数据的特点
(1)结构化的数据和其联系的集合
(2)数据共享性高、冗余度低
(3)数据独立性高(物理独立性和逻辑独立性)
(4)有统一的数据管理和控制功能:包括:①数据的安全性控制;②数据的完整性控制;③并发控制;④数据恢复。
数据库系统的组成
数据库系统主要由数据库、数据库用户、计算机硬件系统和计算机软件系统等几部分组成。
- 数据库:是存储在计算机内、有组织的、可共享的数据和数据对象的集合。其特点为:集成性和共享性。
- 数据库用户:①第一类用户(最终用户)②第二类用户(应用程序员)③第三类用户(数据库管理员,即DBA)。
- 软件系统:包括数据库管理系统(DBMS)及其开发工具、操作系统和应用系统等。
- 硬件系统:指存储和运行数据库系统的硬件设备。
数据库系统的内部体系结构
- 数据库系统的三级模式结构
外模式/子模式/用户模式 | 模式 /逻辑模式/概念模式 | 内模式/存储模式/物理模式 |
---|---|---|
是数据库用户能看到并允许使用的那部分局部数据的逻辑结构和特征的描述 | 数据库全体数据的逻辑结构和特征的描述 | 对数据库存储结构的描述,是数据在数据库内部的表示方式 |
可以有多个 | 一个数据库只能有一个 | 一个数据库只能有一个 |
三者联系: 内模式是整个数据库实际存储的表示,模式是整个数据库实际的抽象表示,外模式是模式的某一部分的抽象表示。
- 数据库系统的二级映像
外模式/模式映像 | 模式 /内模式映像 |
---|---|
确定了数据的局部逻辑结构和全局逻辑结构之间的对应关系 | 确定了数据的全局逻辑结构和与存储结构之间的对应关系 |
保证逻辑独立性 | 保证物理独立性 |
- 数据库系统的三级模式与二级映像的优点:
(1)保证数据的独立性
(2)简化了用户接口
(3)有利于数据共享
(4)有利于数据的安全保密
数据库管理系统
DBMS是实现用户意义下的抽象逻辑数据处理转化为计算机中的具体的物理数据的处理软件。
- DBMS的主要功能如下:
(1)数据定义功能:提供DDL,定义数据的三级模式结构和二级映像,定义有关的约束条件。
(2)数据操纵功能:实现对数据库的基本操作,包括检索、更新(插入,删除,修改)等。
(3)数据库运行管理功能:DBMS通过对数据库的控制以确保数据正确有效和数据库系统的正常运行。其控制体现在以下方面:数据的安全性控制,数据的完整性控制,多用户环境下的并发控制和数据库的恢复。
(4)数据库的建立和维护功能
(5)数据通信接口
(6)数据组织、存储和管理 - DBMS的组成:
(1)语言编译处理程序:包括:数据定义语言DDL编译程序和数据操纵语言DML编译程序。
(2)系统运行控制程序
(3)系统建立维护程序
(4)数据字典:用来描述数据库中有关信息的数据目录。 - DBMS的数据存取过程:
(1)用户使用DML向DBMS发出存取请求
(2)DBMS接受请求并将该请求解释转换为机器代码伪指令
(3)DBMS依次检查外模式、外模式/模式映像、模式、模式/内模式映像以及存储结构定义
(4)DBMS对存储数据库执行必要的存取操作
(5)从对数据库的存取操作中接受结果
(6)对得到的结果进行必要的处理
(7)将处理结果返回给用户
数据模型
数据模式是用来描述数据、组织数据和对数据进行操作的模式。
- 数据模式的分类(依据:模型应用目的)
(1)概念模型/信息模型
概念模型的E-R表示方法: 用矩形框、椭圆形框和菱形框表示实体型、属性和联系,使用无向边将属性和其相应的实体连接起来,并将联系分别和有关实体相连接,注明联系类型。
(2)逻辑模型/数据模型和物理模型
-
数据模型的组成要素
(1)数据结构
(2)数据操作
(3)数据的完整性约束 -
四种数据模型
1、层次模型:用树形数据结构(有向树)来表示各类实体以及实体间的联系。(在这种数据结构中,每个节点表示一个记录型,每个纪录型可包含若干个字段,纪录型描述的是实体,字段描述实体的属性,各个纪录型以及字段都必须命名,结点间的带箭头线段表示纪录型间的联系,连线上端的结点是父结点或者双亲结点,连线下端的结点是子结点或者子女结点。)
(图片来自网络)
2、网状模型:采用有向图结构表示纪录型与纪录型之间联系的数据模型。
3、关系模型:其数据结构是一张规范化的二维表
(学生关系的关系模型)
姓名 | 性别 | 学号 |
---|---|---|
张三 | 男 | 01 |
李四 | 女 | 02 |
王五 | 男 | 03 |
4、面向对象模型
数据仓库
数据仓库:面向主题的、集成的、相对稳定的、反映历史变化的数据集合,通常用于辅助决策支持。