近几期的考情来看,本章选择题稳定考4分,考案例的可能性有,需要重点学习。本章节专业知识点特别多。但是,只考课本原话,大家一定要把本章至少通读一遍,还要多刷题,巩固重点知识。
2数据工程
2.1数据建模
您提供的信息是对数据模型分类及其各自特性的简要概述,下面是对您所列举的各部分的详细解读:
1. 数据模型
数据模型是用于描述数据、数据间关系以及对数据操作规则的一种抽象框架。它是数据库设计的基础,为信息系统提供了一种结构化的数据组织方式。数据模型按照不同的抽象层次和关注点,通常被划分为以下三类:
1.1 概念模型
概念模型,又称信息模型,是从用户角度出发,对现实世界中的数据和信息进行抽象和建模。它旨在捕捉业务需求的核心概念、实体及其相互关系,而不涉及任何特定的计算机系统或数据库管理系统(DBMS)。概念模型的特点包括:
- 用户视角:它关注业务用户关心的实体(如客户、订单、产品等)、属性(如客户姓名、订单金额、产品型号等)以及实体间的关系(如客户订购订单、订单包含产品等),而非技术实现细节。
- 抽象性:模型以高度抽象的方式表示数据和信息结构,忽略具体的存储机制、查询语言和数据访问方式,使得非技术人员也能理解。
- 与技术无关:概念模型不受特定数据库管理系统(DBMS)或计算机系统的约束,适用于多种可能的实现环境。
常见的概念模型表示方法包括实体-关系图(ER图),它使用图形符号(如矩形代表实体、椭圆代表属性、菱形代表关系)来直观地展示实体、属性及其关联。
1.2 逻辑模型
逻辑模型是在概念模型的基础上进一步细化和规范化,形成一种与特定数据库管理系统(DBMS)相关但与具体硬件和操作系统无关的数据结构描述。逻辑模型明确了数据如何在逻辑层面组织、存储和管理,为数据库设计提供了具体的结构蓝图。主要的逻辑数据模型包括:
- 层次模型
- 网状模型
- 关系模型
- 面向对象模型
- 对象关系模型
其中,关系模型由于其简洁的理论基础、强大的表达能力和广泛的支持,已成为目前最广泛应用的逻辑数据模型。关系模型使用二维表格结构(即关系表)来表示数据,通过键(如主键、外键)来维护数据的一致性和完整性,并使用标准的结构化查询语言(SQL)进行数据操作。
1.3 物理模型
物理模型是在逻辑模型的指导下,结合具体数据库管理系统(DBMS)、操作系统和硬件环境,设计出数据在实际存储介质上的组织方式和存取方法。物理模型关注的细节包括:
- 数据存储结构:如数据如何在磁盘上分布、如何分块存储等。
- 物理数据类型:如字符长度、浮点数精度、日期时间格式等。
- 索引策略:选择合适的索引类型(如B树、哈希等)和索引字段,优化查询性能。
- 分区方案:根据数据规模和访问模式划分数据,提高存储效率和并发处理能力。
- 并发控制和恢复机制:确保在多用户环境下数据的一致性和事务的可靠性。
物理模型设计的目标是充分利用硬件资源,确保数据的高效存储和访问,同时考虑到备份、恢复、容灾等方面的考虑。虽然物理模型的许多细节通常由DBMS自动处理或提供默认配置,但设计者仍需根据应用特点和性能要求做出有针对性的选择和调整。
2.数据建模过程
数据建模过程包括数据需求分析、概念模型设计、逻辑模型设计和物理模型设计等过程。
2.2 数据标准化♥♥♥♥♥
1. 元数据标准化
1.1 元数据定义
元数据,正如您所述,是指关于数据的数据,即对信息资源或数据的一种结构化描述。它包含了关于数据本身、数据来源、数据创建过程、数据内容特征、数据关系、数据使用权限、数据更新历史等多方面的信息。元数据旨在提供必要的上下文和背景知识,使得数据能够被有效地发现、理解、管理和利用。
1.2 元数据描述的对象
元数据所描述的对象范围广泛,涵盖了各种不同类型的信息资源:
- 单一资源:包括全文文本、目录、图像、数值型数据、音频文件、视频文件等各类数字化或非数字化的单个信息单元。
- 资源集合:由多个单一资源组成的集合,如电子图书、期刊合辑、图片库、音视频专辑、数据库中的数据表集合等。
- 过程与参数:不仅描述资源本身,还包括资源的生产、加工、使用、管理、技术处理、保存等整个生命周期过程,以及过程中产生的各种参数(如数据采集设备参数、处理算法参数、存储