教材:王珊 萨师煊 编著 数据库系统概论(第5版) 高等教育出版社
注:文档高清截图在后
第2章 关系数据库
2.1 关系数据结构及其形式化定义
1、关系数据库系统是支持关系模型的数据库系统。关系模型由IBM的E.F.Codd提出。E.F.Codd因此获得Turing奖。目前全球的数据库几乎都为关系数据库。第1章初步介绍了关系模型及其基本术语,本章将稍微深入地介绍关系模型。
回忆:数据模型的三要素是:数据结构、数据操作、数据的完整性约束条件。简单说成:结构、操作、约束条件。
2、关系模型的数据结构就是关系。关系可以画成二维表来表示。这种结构虽然简单,却能表达丰富的语义,描述现实世界的实体及各种联系。关系模型建立在集合代数的基础上,下面从集合论的角度给出关系数据结构的形式化定义。
3、域(domain)是一组相同类型的值的集合。
例如:自然数、整数、实数、复数、32字节以内的字符串集合、{0,1}、{男、女}、离散闭区间 [0, 255] 、double能表示的全部数、本校全体学生、某人的计算机中包含的全部单机游戏、S店于2019年8月售出的全部UHD BD、作家N创作的全部科幻小说。
4、笛卡尔积(cartesian product)是一种集合运算。设集合D1,D2,……,Dn,则它们的笛卡尔积为
cartesian = 与Rene Descartes相关的。
笛卡尔积生成的元素 (d1,d2,……,dn) 叫作一个n元组(n-tuple),简称元组(tuple)。元素中的每一个值都是一个分量(component)。
笛卡尔积可以表示为一张二维表。每行对应一个元组,而每列的值都来自一个域。
例如:给出导师姓名、研究方向、研究生姓名的集合
D1 = {胡安,张维文,祁连武},D2 = {计算机视觉,自然语言处理,语音识别},D3 = {林小亮,李立思,黄佳琪}。则
D1×D2×D3 =
{
(胡安,计算机视觉,林小亮),(胡安,计算机视觉,李立思),(胡安,计算机视觉,黄佳琪),
(胡安,自然语言处理,林小亮),(胡安,自然语言处理,李立思),(胡安,自然语言处理,黄佳琪),
(胡安,语音识别,林小亮),(胡安,语音识别,李立思),(胡安,语音识别,黄佳琪),
(张维文,计算机视觉,林小亮),(张维文,计算机视觉,李立思),(张维文,计算机视觉,黄佳琪),
(张维文,自然语言处理,林小亮),(张维文,自然语言处理,李立思),(张维文,自然语言处理,黄佳琪),
(张维文,语音识别,林小亮),(张维文,语音识别,李立思),(张维文,语音识别,黄佳琪),
(祁连武,计算机视觉,林小亮),(祁连武,计算机视觉,李立思),(祁连武,计算机视觉,黄佳琪),
(祁连武,自然语言处理,林小亮),(祁连武,自然语言处理,李立思),(祁连武,自然语言处理,