(一)引言
我们知道,家庭物品收纳整理有个重要的原则,就是分类。人们不会把所有的衣物乱堆在一起,而会按衣服的用途、颜色等等进行分类,这样衣物才会井然有序,容易取用。
类似的,现代企业的数据容量爆发式增长,如果没有数据模型,数据就会杂乱无章。人们需要对数据按业务概念进行抽象和归类,设计数据结构,让数据各归其位,这就是数据建模的过程。
(二)数据建模的重要性
数据建模影响重大,因为它是业务与技术之间的桥梁。企业从数据库的建立之初,到日常的数据分析,无时无刻不与数据模型打交道。
当业务人员对日常数据进行分析时,当决策层依据数据做决策时,必需要将业务语言依据数据模型转化为查询。一个好的数据模型,能让数据分析人员容易理解,也容易使用,并且解决日常的业务问题性能足够优秀、消耗的资源足够少。因此设计模型有比较强的查询用例导向性。
对于分析类的数据库来说,数据建模还要考量输入数据格式。我们要基于已有的数据挖掘其中的信息,而不能脱离实际。
二、数据建模的常用方法
(一)E-R模型
数据建模最常用的方法,就是E-R(实体-关系)模型,它在传统的关系型数据库中就已经非常流行,其本质上是一种图的方法,也就是关心数据中有哪些实体,有哪些属性可以用来描述这些实体,实体与实体之间有哪些重要的关系,然而再将这些实体、关系和属性的类别进行抽象。
举个例子,学校里有很多学生、很多老师,也开了很多课堂,那么就可以把学生、老师和课堂抽象成三类实体。我们会发现,最容易抽象为实体的类型往往是一些名词。每个实体都有一些描述本身特征的点,比如描述老师的姓名、性别、年龄等等,这在数据模型中称为属性。而实体与实体之间常常都有某种关系,比如李学生参