设计过程
- 数据库模式
- 访问更新数据库的程序
- 控制数据访问的安全模式
阶段:
- 概念设计阶段:实体联系图
- 逻辑设计阶段:E-R图映射到关系模式
- 物理设计阶段: 指明数据库文件组织格式、索引结构
可能的问题:
- 冗余
- 不完整
实体-联系模型
E-R模型是一种语义模型,将现实世界含义,相互关联映射到概念模型方面
有三个基本概念
- 实体集
- 联系集
- 属性
数据库可建模为
- 实体的集合
- 实体间联系
实体集
实体解释:现实世界可区别于其他所有对象的“对象”
实体集解释:相同类型的实体集合
实体集外延指属于实体机的实体的实际集合
(类比对象的实际取值集合)
实体有属性:他是实体集中每个成员拥有的描述性性质,实体属性都对应一个值
联系集
联系:多个实体之间的相互联系
联系集是同类型联系的集合
联系集也可以有属性
如instructor和student之间的联系集advisor可以有属性date表示教师称为学生导师的日期
联系集中实体的角色
实体在联系中扮演的功能称为实体的角色
角色是隐含的,通常不指定
同样的实体集参与一个联系集多于一次,这类联系集称为递归联系集
如:课程先修关系prereq
需要用角色指明实体如何参与联系实例
联系集的度
参与联系集的实体集数目为联系集的度
二元联系集
- 设计两个实体集
- 数据库系统中大多数联系集都是二元的
两个实体集以上的联系较少
属性
实体通过一组属性表示,属性是实体集中每个成员拥有的描述性性质
instructor = (ID, name, street, city, salary)
course = (course_id, title, credits)
域 – 每个属性可取值的集合,也叫做值域
属性类型:
- 简单or复合属性
- 单值or多值属性
比如多值属性phone_numbers - 派生属性or基属性
派生属性可从别的属性派生
派生属性值不储存,需要的时候计算出来(如ave
符合属性可以有层次
约束
映射基数约束
基数映射(基数比率):一个实体通过一个联系集能关联的实体的个数
对二元联系集来说,映射基数为以下情况:
- 1 to 1
- 1 to multi
- multi to 1
- multi to multi
两个集合(如A)中的某些元素可能并不映射到另一集合(B)中的任一元素
参与约束
若实体集E 每个实体都参与到联系集R的至少一个练习中,实体集E在联系集R的参与称为全部的(total)
若实体集E只有部分实体参与到R的联系中,上面称为部分的(partial)
实体集的码
一个实体集的超码是一个或多个可以用来唯一地标识实体的属性(集)
一个实体集的候选码是最小的超码
- ID是instructor的候选码
- course_id是course的候选码
主码:被选择区分实体的候选码
主码只有一个,超码可以有多个
联系集的码
如果联系集R没有属性,那么属性集合
primary−key(E1)∪primary−key(E2)∪…∪primary−key(En)primary-key(E1) ∪ primary-key(E2) ∪…∪ primary-key(En)primary−key(E1)∪primary−key(E2)∪…∪primary−key(En)
描述R的联系
如果联系集R有属性a1,a2,…,ama_1,a_2, …, a_ma1,a2,…,am,那么属性集合
primary−key(E1)∪primary−key(E2)∪…∪primary−key(En)∪a1,a2,…,amprimary-key(E1) ∪ primary-key(E2) ∪…∪ primary-key(En)∪ {a_1,a_2, …, a_m}
primary−key(E1)∪primary−key(E2)∪…∪primary−key(En)∪a1,a2,…,am
描述了集合R中的一个联系
相关实体集的主码行成联系集的超码
以上两种情况下
primary−key(E1)∪primary−key(E2)∪…∪primary−key(En)primary-key(E1) ∪ primary-key(E2) ∪…∪ primary-key(En)primary−key(E1)∪primary−key(E2)∪…∪primary−key(En)
总是构成联系集的一个超码
比如
(s_id,i_id)是advisor的超码
✓表示一对实体集在一个特定的联系集中只能有一个
联系
决定候选码时必须考虑联系集的映射基数
✓一对一、一对多、多对一、多对多
冗余属性
假设有实体集
- instructor实体集有dept_name属性
- department实体集和联系集
- inst_dept,联系instructor和departmen
instructor中的dept_name 属性是冗余的,因为有一个明确的关系inst_dept 来联系 instructor 和department
✓dept_name属性重复了inst_dept联系中的信息,应该从instructor中除去
实体-联系图

- 矩形代表实体集
- 属性在实体矩阵中列出
- 构成主码的属性以下划线标明
- 菱形代表联系集
全部参与(两条线表示):实体集每个实体都参与到联系集至少一个联系中
如:section全部参与sec_course 每个section都有一个course

部分参与:某些实体不参与到联系集中的任何一个联系
例:部分instructor 参与到advisor 中

基数约束
联系集和实体集之间用箭头→\rightarrow→表示**“一”**
或一条线段表示**“多”表示技术约束

一对一联系
instructor和student之间的一对一**联系
- 一个insturctor通过advisor至多与一个student相联系
- 一个student通过advisor至多与一个insturctor联系

instructor 与student之间的一对多联系
一个instructor通过advisor与多个student(包括0个)相联系
一个student通过advisor至多与一个instructor相联系

instructor 与student之间的多对一联系
一个instructor通过advisor至多与一个student相联系
一个student 通过advisor与多个instructor(包括0个)相联系

多对多
一个instructor通过advisor与多个student(包括0个)相联系
一个student 通过advisor与多个instructor(包括0个)相联系

基数限制也可以用参与约束来表示

具有复合、多值、派生属性的实体

角色
一个联系的实体集不需要唯一
一个实体集中的元素每次出现都在关系中代表一个“角色”
course_id和prereq_id被称为角色

三元联系E-R图

基数约束:
我们只允许在一个三元(或三元以上)联系集外有一个箭头来表示基数约束
从proj_guide到instructor的箭头表示每个学生在每个项目上至多有一个导师来指导
有多于一个的箭头,那就会有两种解释
R 是 A, B 和C 之间的三元联系集,并且有两个箭头指向B和C,这可以表示为
- 每个在A中的实体都与来自B和C的至多一个实体相关联
- 每个来自(A, B) 的实体对都与来自C的至多一个实体相关联,而每个来自(A, C) 的实体对都与来自B的至多一个实体相关联
弱实体集
- 一个没有足够的属性形成主码的实体集叫做弱实体集
- 弱实体集必须与标识或属主实体集(owner entity set)关联才有意义
弱实体集存在依赖于标识实体集 - 将弱实体集与其标识实体集相连的联系称为标识性联系
标识联系集以双边框菱形表示 - 弱实体集通过一个全部参与的、(多对一或一对一)的联系集与标识实体集联系
- 弱实体集的分辨符是使得我们区分弱实体集中实体的属性集合,也称为该弱实体集的部分码
- 弱实体集的主码由标识实体集的主码和该弱实体集的分辨符共同组成
- 弱实体集的分辨符用虚下划线表示
- 标识联系集以双边框的菱形表示
- section的主码 – (course_id, sec_id, semester, year)

- 强实体集的主码并不存储于弱实体集
如果course_id被隐含的存储,section会是一个强实体集,这样section和course之间的联系集将会重复存储course_id属性 - 弱实体集可以参与标识性联系以外的其他联系,也可能与不止一个标识实体集关联
- 在某些情况下,数据库设计者会选择将一个弱实体集表示为属主实体集的一个(多值)复合属性
如果弱实体集只参与标识性联系,而且其属性不多,建模时更适合将其作为属性
反之,更适合将其表示为弱实体集
转换为关系模式
一个符合E-R模型的数据库可以表示为一些关系模式的集合
- 实体集和联系集都可以用表示数据库内容统一的关系模式表示
- 每个实体集和联系集都有一个特有的关系模式对应,且有对应的名字
- 每个关系模式都有一些列,每个列有唯一名字
简单属性实体集表示
从强实体集转换模式与强实体集有相同属性、主码
student(ID, name, tot_cred
从弱实体集转换的模式包含弱实体集的属性和标识强实体集的主码
该模式主码有强实体集主码和弱实体集分辨符组合
section( course_id, sec_id, sem, year)
需要建立相应的外码约束和完整性约束(如联机删除

复合属性通过为每个子属性创建单独的属性
实体集instructor有复合属性name:由first_name、
middle_initial和last_name构成
转化关系模式后,该实体集具有name_first_name、
name_middle_name和name_last_name
不考虑多值属性的话,扩展的instructor模式是
instructor(ID, first_name, middle_initial, last_name,
street_number,street_name,apt_number,
city,
state,
zip_code,
date_of_birth)
多值属性
实体集E 的多值属性M 用一个独立的模式EM 表示
模式EM 包含对应于的E 主码及多值属性M 的属性
例子:instructor的多值属性phone_number在模式中表示为
instphone=(ID‾,phone_number‾)inst_phone= ( \underline{ID}, \underline{phone\_number})instphone=(ID,phone_number)
多值属性的每个值映射到关系模式EM 的每一个独立元组
- 一个实体instructor的主码22222及电话号码456-7890和123-4567映射到两个元组: (22222, 456-7890) 和 (22222, 123-4567)
- 在关系模式EM上建立参照实体集E关系模式主码的外码约束
time_slot除了主码外只有一个多值属性
不需要建立一个对应于实体集的模式,只需要简历一个对应于多值属性的关系即可
timeslot(time_slot_id,day,start_time‾,endtime)
time_slot(\underline{time\_slot\_id, day, start\_time}, end_time)
timeslot(time_slot_id,day,start_time,endtime)
sec_time_slot中的time_slot_id属性在这样处理后不能作为被参照的外码

表示
联系集关系模式属性的选择
需要为联系集属性建立外码约束
例子:advisor模式
advisor=(s_id‾,i_id)advisor = (\underline{s\_id}, i\_id)advisor=(s_id,i_id)
冗余-合并
多对一、一对多联系集的模式
若“多”方参与的是全部的 total那么可以将多方实体集和联系集模式合并成单个包含两个模式所有属性并集的关系模式
合并后模式中加入原联系集的外码约束
将属性dept_name加入到实体集instructor的模式中,而不是新建一个联系集inst_dept的模式

如果若“多”方参与的是部分的 partial,可以通过使用空值进行模式合并。
转换为关系模式的时候。联系集中的“一”方的相关属性不能设为not null
一般而言:
连接弱实体集与强实体集的标识性联系集转换出的模式是冗余的
例子:section(弱实体)的关系模式已经包含了出现在
sec_course模式中的属性
实体-联系设计问题
使用实体集vs. 属性

phone作为实体集有额外信息
注意避免以下错误:
- 实体集主码作为另一个实体集的属性
- 相关实体集的主码属性作为联系集的属性
若信息与其他实体集相联系,可以继续设置更多联系集
(当描述实体之间可能发生的行为时采用联系集)
创建一个实体集可以将非二元联系集 — 转换 —>为 二元联系集

所有非二元的联系集可以用多个二元联系集来表示,但有时n元的联系集能够更清楚的表示几个参与的实体集之间的联系
联系属性的布局
联系集的描述性属性 – 是 联系集的?还是实体集的?
由映射基数约束决定
- 一对多,放到参与联系的“多”方实体集
- 一对一,可放任意一个
- 属性—由参与的实体集联合决定而非单独实体集决定。必须放到多对多联系集中
扩展的E-R特性
自顶向下:从初始实体集到一系列不同层次的实体子集细化
特化 specialization:实体集内部分组过程
子集的实体再某些方面区别于实体集中的其他实体
- 自己成为了较低层的实体集
- 可能有高层实体集没有的属性
- 或参与高层实体集不参与的联系集中
特化从特化实体指向另一个实体的空箭头表示

自底向上:
多个实体集根据共同优点特征综合为一个叫高层实体集
概化 generalization
- 这些子集成为较低层实体集
- 可能有高层实体集没有的属性
- 或参与到高层实体集不参与的联系集中
概化和特化互逆,可以互换使用
他们在E-R图表示享同,区别在于不同的出发点和目标
高层、底层实体集可以形成超类、-类
UML
UML(Unified Modeling Language): 统一建模语言
➢ UML包含了将整个软件系统图形化的很多组件
➢ UML类图与E-R图类似,仅有一些不同


总结
➢ 什么是实体、联系、实体-联系数据模型?
➢ 什么是弱实体集、强实体集、属性?
➢ 什么是映射基数、参与度约束?
➢ 如何从E-R图转换为关系模式?
➢ E-R图设计和转换关系模式中有哪些常见问题?
➢ 什么是特化、概化(泛化)?
➢ 什么是UML?
本文围绕数据库设计展开,介绍了实体 - 联系(E - R)模型,包括实体集、联系集、属性等基本概念,阐述了约束条件,如映射基数约束、参与约束等。还说明了如何将 E - R 图转换为关系模式,以及设计过程中可能遇到的问题,最后提及扩展的 E - R 特性和 UML。
9358

被折叠的 条评论
为什么被折叠?



