使用关系代数合并数据<br />1 关系代数<br />合并数据集合的理论基础是关系代数,它是由E.F.Codd于1970年提出的。<br />在关系代数的形式化语言中:<br />? 用表、或者数据集合表示关系或者实体。<br />? 用行表示元组。<br />? 用列表示属性。<br />关系代数包含以下8个关系运算符<br />? 选取――返回满足指定条件的行。<br />? 投影――从数据集合中返回指定的列。<br />? 笛卡尔积――是关系的乘法,它将分别来自两个数据集合中的行以所有可能的方式进行组合。<br />? 并――关系的加法和减法,它可以在行的方向上合并两个表中的数据,就像把一个表垒在另一个表之上一样。<br />? 交――返回两个数据集合所共有的行。<br />? 差――返回只属于一个数据集合的行。<br />? 连接――在水平方向上合并两个表,其方法是:将两个表中在共同数据项上相互匹配的那些行合并起来。<br />? 除――返回两个数据集之间的精确匹配。<br />此外,作为一种实现现代关系代数运算的方法,SQL还提供了:<br />? 子查询――类似于连接,但更灵活;在外部查询中,方式可以使用表达式、列表或者数据集合的地方都可以使用子查询的结果。<br />本章将主要讲述多种类型的连接、简单的和相关的子查询、几种类型的并、关系除以及其他的内容。<br />2 使用连接<br />2.1 连接类型<br />在关系代数中,连接运算是由一个笛卡尔积运算和一个选取运算构成的。首先用笛卡尔积完成对两个数据集合的乘运算,然后对生成的结果集合进行选取运算,确保只把分别来自两个数据集合并且具有重叠部分的行合并在一起。连接的全部意义在于在水平方向上合并两个数据集合(通常是表),并产生一个新的结果集合,其方法是将一个数据源中的行于另一个数据源中和它匹配的行组合成一个新元组。<br />SQL提供了多种类型的连接方式,它们之间的区别在于:从相互交叠的不同数据集合中选择用于连接的行时所采用的方法不同。<br />连接类型 定义<br