SQL概述
结构化查询语言,是关系数据库的标准语言,是一个通用的,功能极强的关系数据库语言
SQL的产生与发展
目前没有一个数据库系统能够支持SQL标准的所有概念和特性
SQL的特点
综合统一
集数据定义语言(DDL),数据操纵语言(DML),数据控制语言(DCL)功能于一体
可以独立完成数据库生命周期中的全部活动
- 定义和修改、删除关系模式,定义和删除视图,插入数据,建立数据库
- 对数据库中的数据进行查询和更新
- 数据库重构与维护
- 数据库安全性、完整性控制以及事务控制
- 嵌入式SQL和动态SQL定义
用户数据库投入运行后,可根据需要随时逐步修改模式,不影响数据库的运行
数据操作符统一
高度非过程化
非关系数据模型的数据操纵语言“面向过程”,必须指定存取路径
SQL面向问题,无需了解存取路径
存取路径的选择以及SQL的操作过程由系统自动完成
面向集合的操作方式
非关系数据模型采用面向记录的操作方式,操作对象是一条记录
SQL采用集合操作方式
- 操作对象,查找结果可以是元组的集合
- 一次插入,删除,更新操作的对象可以是元组的集合
以同一种语法结构提供多种使用方式
SQL是独立的语言——能够独立地用于联机交互的使用方式
SQL又是嵌入式语言——SQL能够嵌入到高级语言(例如C,C++,Java)程序中,供程序员设计程序时使用
语言简洁,易学易用
SQL功能极强,完成核心功能只用了9个动词
SQL功能 | 动词 |
数据查询 | select |
数据定义 | create(建立)drop(删除)alter(修改) |
数据操纵 | insert(插入)update(修改)delete(删除) |
数据控制 | grant(授予权限)revoke(收回权限) |
SQL的基本概念
- 支持关系数据库三级模式结构
- 外模式——视图&&部分基本表
- 模式——基本表
- 内模式——存储文件
基本表
- 本身独立存在的表
- SQL中一个关系就对应一个基本表
- 一个(或多个)基本表对应一个存储文件
- 一个表可以带若干索引
存储文件
- 逻辑结构组成了关系数据库的内模式
- 物理结构对用户是隐蔽的
视图
- 从一个或几个基本表导出的表
- 数据库中只存放视图的定义而不存放视图对应的数据
- 视图是一个虚表
- 用户可以在视图上再定义视图
学生-课程数据库
学生表
课程表
成绩表
数据定义
SQL的数据定义功能
- 模式定义
- 表定义
- 视图和索引的定义
模式
数据库(有的系统称为目录)-->模式-->表以及视图、索引等
现代关系数据库管理系统提供了一个层次化的数据库对象命名机制
- 一个关系数据库管理系统的实例中可以建立多个数据库
- 一个数据库中可以建立多个模式
- 一个模式下通常包括多个表,视图和索引等数据库对象
模式的定义与删除
定义模式
定义模式实际上定义了一个命名空间
在这个空间中可以定义该模式包含的数据库对象,例如基本表,视图,索引等
在CREATE SCHEMA中可以接受CREATE TABLE,CREATE VIEW和GRANT子句
CREATE SCHEMA <模式名> AUTHORIZATION <用户名>[<表定义子句>|<视图定义子句>|<授权定义子句>]
删除模式
DROP SCHEMA<模式名><CASCADE|RESTRICT>
CASCADE(级联)——删除模式的同时把该模式中所有的数据库对象全部删除
RESTRICT(限制)——如果该模式中定义了下属的数据库对象(如表,视图等),则拒绝该删除语句的执行,仅当该模式中没有任何下属的对象时才能执行
基本表的定义、删除与修改
定义基本表
如果完整性约束条件涉及到该表的多个属性列,则必须定义在表级上,否则既可以定义在列级也可以定义在表级
数据类型
SQL中域的概念用数据类型来实现
定义表的属性时需要指明其数据类型及长度
选用那种数据类型
- 取值范围
- 要做那些运算
在 MySQL 中,有三种主要的类型:Text(文本)、Number(数字)和 Date/Time(日期/时间)类型
模式与表
每个基本表都属于某一个模式
一个模式包含多个基本表
定义基本表所属模式
- 在表名中明显的给出模式名
- 在创建模式语句中同时创建表
- 设置所属的模式
创建基本表时,如果没有指定模式,系统根据搜索路径来确定该对象所属的模式
关系数据库管理系统会使用模式列表中第一个存在的模式作为数据库对象的模式名
若搜索路径中的模式名都不存在,系统将给出错误
显示当前搜索路径:
SHOW search_path
搜索路径的当前默认值;
$user,PUBLIC
数据库管理员用户可以设置搜索路径,然后定义基本表
SET search_path TO "S-T",PUBLIC;
Create table Student(...);
结果建立了S-T.Student基本表
关系数据库挂了你系统发现搜索路径中第一个模式名S-T,就把该模式作为基本表Student所属的模式
修改基本表
ADD子句用于增加新列,新的列级完整性约束条件和新的表级完整性约束条件
在新增数据列的时候,无论基本表中原来是否有数据,新增列一律为空值
因为我用的是MySQL,所以修改原表列的数据类型用modify子句
DROP COLUMN子句用于删除指定的完整性约束条件
DROP CONSTRAINT子句用于删除指定的完整性约束条件
索引的建立与删除 -- 内模式
建立索引的目的:加快查询速度
关系数据库管理系统总常见的索引:
- 顺序文件上的索引
- B+树索引
- 散列索引
- 位图索引
特点:
- B+树索引具有动态平衡的优点
- HASH索引具有查找速度快的特点
数据库管理员或表的属主(建立表的人)可以建立索引
关系数据库管理系统自动维护索引
关系数据库管理系统自动选择合适的索引作为存取路径,用户不必也不能显示地选择索引
建立索引
显示索引
删除索引
索引可以建立在表的一列或者多列上,各列名之间用逗号分隔
可以用CLUSTER表示建立的索引是聚簇索引,但是如果表经常更新则不建议这种索引
数据字典
数据字典是关系数据库管理系统内部的一组系统表,它记录了数据库中所有定义信息;
- 关系模式定义
- 视图定义
- 索引定义
- 完整性约束定义
- 各类用户对数据库的操作权限
- 统计信息等
关系数据库管理系统在执行SQL的数据定义语句时,实际上就是在更新数据字典表中的相应信息
数据查询
SELECT子句:指定要显示的属性列
FROM子句:指定查询对象(基本表或视图)
WHERE子句:指定查询条件
GROUP BY子句:对查询结果按指定列的值分组,该属性列值相等的元组为一个组。通常会在每组中作用聚集函数
HAVING短语:只有满足指定条件的组才予以输出
ORDER BY子句:对查询结果表按指定列值升序或降序排列
单表查询
查询仅涉及一个表
选择表中的若干列
查询指定列
查询全部列
全部列和指定列之间的区别就是一个只有部分列,一个是全部的列,全部的列可以全部列出来,也可以直接用*代替
查询经过计算的值
使用列别名改变查询结果的列标题
选择表中的若干元组
消除取值重复的行
指定DISTINCT关键词,去掉表中重复的行
查询满足条件的元组
比较大小
确定范围
确定集合
字符匹配
能写=就不要写like,因为like有限制条件
涉及空值的查询
多重条件查询
ORDER BY子句
聚集函数
- 统计元组个数——COUNT(*)
- 统计一列中值的个数————COUNT([DISTINCT|ALL]<列名>)
- 计算一列值的总和(此列必须为数值型)——SUM([DISTINCT|ALL]<列名>)
- 计算一列值的平均值(此列必须为数值型)——AVG([DISTINCT|ALL]<列名>)
- 求一列中的最大值和最小值——MAX | MIN([DISTINCT|ALL]<列名>)
GROUP BY子句
细化聚集函数的作用对象
- 如果未对查询结果分组,聚集函数将作用于整个查询结果
- 对查询结果分组后,聚集函数将分别作用于每个组
- 按指定的一列或多列值分组,值相等的为一组
- 默认升序
HAVING短语和WHERE子句的区别:
- 作用对象不同
- WHERE子句作用于基表或视图,从中选择满足条件的元组
- HAVING 短语作用于组,从中选择满足条件的组
连接查询
SQL本身无连接操作
连接查询:同时涉及两个以上的表的查询
连接条件或连接谓词:用来连接两个表的条件
连接字段:连接谓词中的列名称
连接条件中的各连接字段类型必须是可比的,但名字不必相同
等值与非等值连接查询
等值连接:连接运算符为=
连接操作的执行过程:
嵌套循环法
- 首先在表1中找到第一个元组,然后从头开始扫描表2,逐一查找满足连接件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组
- 表2全部查找完后,再找表1中第二个元组,然后再从头开始扫描表2,逐一查找满足连接条件的元组,找到后就将表1中的第二个元组与该元组拼接起来,形成结果表中一个元组
- 重复上述操作,直到表1中的全部元组都处理完毕
排序合并法
- 常用于=连接
- 首先按连接属性对表1和表2排序
- 对表1的第一个元组,从头开始扫描表2,顺序查找满足连接条件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组。当遇到表2中第一条大于表1连接字段值的元组时,对表2的查询不在继续
- 找到表1的第二条元组,然后从刚才的中断点处继续顺序扫描表2,查找满足连接条件的元组,找到后就将表1中的第一个元祖与该元组拼接起来,形成结果表中一个元组。直接遇到表2中大于表1连接字段值的元组时,对表2的查询不在继续。
- 重复上述操作,直到表1或表2中的全部元组都处理完毕为止
索引连接
- 对表2按连接字段建立索引
- 对表1中的每个元组,依次根据其连接字段值查询表2的索引,从中找到满足条件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组
自然连接
一条SQL语句可以同时完成选择和连接查询,这时WHERE子句是由连接谓词和选择谓词组成的复合条件
执行过程:
- 先从sc中挑选出Cno = '2'并且Grade > 90的元组形成一个中间关系
- 再和student中满足连接条件的元组进行连接得到最终的结果关系
自身连接
自身连接:一个表与其自己进行连接
需要给表起别名以示区别
由于所有属性名都是同属性名,因此必须使用别名前缀
外连接
外连接与普通连接的区别
- 普通连接操作只输出满足连接条件的元组
- 外连接操作以指定表为连接主体,将主体表中不满足连接条件的元组一并输出
- 左外连接
- 列出左边关系中所有的元组
- 右外连接
- 列出右边关系中所有的元组
多表连接
两个以上的表进行连接
嵌套查询
嵌套查询概述:
一个SELECT-FROM-WHERE语句称为一个查询块
将一个查询块嵌套在另一个查询块的WHERE子句或HAVING短语的条件中的查询称为嵌套查询
有些嵌套可以用连接表示
SQL语言允许多层嵌套查询——即一个子查询中还可以嵌套其他子查询
子查询的限制——不能使用ORDER BY子句
不相关子查询:
子查询的查询条件不依赖与父查询
有里向外,逐层处理,即每个子查询在上一级查询处理之前求解,子查询的结果用于建立其父查询的查找条件
相关子查询:
子查询的查询条件依赖于父查询
- 首先取外层查询中表的第一个元组,根据它与内层查询相关的属性值处理内层查询,若WHERE子句返回值为真,则取此元组放入结果表
- 然后再取外层表的下一个元组
- 重复这一过程,直至外层表全部检查完为止
带有IN谓词的子查询
无关查询最好使用连接
将查询分为N步,将第N-1步利用IN放入第N步的WHERE子句中,将N-2放入N-1中……
带有比较运算符的子查询
当能确切知道内层查询返回单值时,可用比较运算符(>,<,=,>=,<=,!=或<>)
用=替代IN
因为有比较,所以是相关子查询,父查询需要满足条件
带有ANY(SOME)或ALL谓词的子查询
使用ANY或ALL谓词时,必须同时使用比较运算符
>ANY | 大于子查询结果中的某个值 |
>ALL | 大于子查询中的所有值 |
<ANY | 小于。。。 |
<ALL | 小于。。。 |
>=ANY | 大于等于。。。 |
>=ALL | 大于等于。。。 |
<=ANY | 小于等于。。。 |
<=ALL | 小于等于。。。 |
=ANY | 等于。。。 |
=ALL | 等于。。。 |
!=(或<>)ANY | 不等于。。。 |
!=(或<>)ALL | 不等于。。。 |

带有EXISTS谓词的子查询
EXISTS谓词
存在量词
带有EXISTS谓词的子查询不返回任何数据,只产生逻辑真值true和逻辑假值false
- 若内层查询结果非空,则外层的WHERE子句返回真值
- 若内层查询结果为空,则外层的WHERE子句返回假值
由EXISTS引出的子查询,其目标列表表达式通常用*,因为带个EXISTS的子查询只返回真值或假值,给出列名无实际意义
不同形式的查询间的替换
- 一些带EXISTS或NOT EXISTS谓词的子查询不能被其他形式的子查询等价替换
- 所有带IN谓词,比较运算符,ANY和ALL谓词的子查询都能用带EXISTS谓词的子查询等价替换
用EXISTS/NOT EXISTS实现全称量词
- SQL语言中没有全称量词
- 可以把带有全称量词的谓词转换成等价的带有存在量词的谓词(
¬(
(¬P))
用EXISTS/NOT EXISTS实现逻辑蕴涵
- SQL语言中没有蕴含逻辑运算
- 可以利用谓词演算将逻辑蕴含谓词等价转换为:p→q≡¬p∨q
集合查询
GROUP BY不可以存在SELECT中,因为会找不到
GROUP BY中的列不一定要出现在SELECT中
语义是人的解释,所以人能听懂能区分但是机器不能
HAVING是对分组的约束
HAVING是限制在分组的属性上的时候可以被WHERE代替
WHERE先执行,HAVING后执行,前面限制越多,程序效率越高,因此能用WHERE代替HAVING的时候尽量用WHERE
嵌套子查询中可以使用DISTINCT
嵌套子查询只有在不相关的查询中才会有相应的连接
集合操作的种类
- 并UNION
- 交INTERSECT
- 差EXCEPT
参加集合操作的各查询结果的列数必须相同;对应项的数据类型也必须相同
UNION将多个查询结果合并起来,系统自动去掉重复元组
UNION ALL将多个查询结果合并起来时,保留重复元组
因为MySQL不支持交集和差的运算,所以这里就不截图展示了,给大家看一下代码
交集:
SELECT Sno
FROM SC
WHERE Cno = '1'
INTERSECT
SELECT Sno
FROM SC
WHERE Cno = '2';
差集:
SELECT *
FROM Student
WHERE Sdept = 'CS'
EXCEPT
SELECT *
FROM Student
WHERE Sage <= 19;
基于派生表的查询
子查询不仅可以出现在WHERE子句中,还可以出现在FROM子句中,这时子查询生成的临时派生表成为主查询的查询对象
Select语句的一般形式
目标列表达式的可选格式
目标列表达式格式
- *
- <表名>*
- COUNT([DISTINCT|ALL]*)
- [<表名>.]<属性列名表达式>[,<表名>.]<属性列名表达式>...
其中属性列名表达式可以是由属性列,作用于属性列的聚集函数和常量的任意算术运算(+,-,*,/)组成的运算公式
聚集函数的一般格式
WHERE子句的条件表达式的可选格式
数据更新
插入数据
两种插入数据方式
- 插入元组
- 插入子查询结果
- 可以一次插入多个元组
插入元组
语句格式
INSERT
INTO<表名>[(<属性列1>[,<属性列2>...)]
VALUES(<常量1>[,<常量2>]...)
功能
将新元组插入指定表中
INTO子句
- 指定要插入数据的表明及属性列
- 属性列的顺序可与表定义中的熟悉怒不一致
- 没有指定属性列:表示要插入的是一条完整的元组,且属性列属性与表定义中的顺序一致
- 指定部分属性列:插入的元组在其余属性列上取空值
VALUES子句
提供的值必须与INTO子句匹配
- 值的个数
- 值的类型
插入子查询结果
语句格式
INSTER
INTO<表名>[(<属性列1>[,<属性列2>...)]
子查询;
INTO子句
子查询
- SELECT子句目标列必须与INTO子句匹配
- 值的个数
- 值的类型
关系数据库管理系统在执行插入语句时会检查所插元组是否破坏表上已定义的完整性规则
- 实体完整性
- 参照完整性
- 用户定义的完整性
- NOT NULL约束
- UNIQUE约束
- 值域约束
修改数据
语句格式
UPDATE<表名>
SET<列名>=<表达式>[,<列名>=<表达式>]...
[WHERE<条件>];
功能:
- 修改指定表中满足WHERE子句条件的元组
- SET子句给出<表达式>的值用于取代相应的属性列
- 如果省略WHERE子句,表示要修改表中的所有元组
三种修改方式:
- 修改某一元组的值
- 修改多个元组的值
- 带子查询的修改语句
修改某一元组的值
修改多个元组的值
修改的元组不能是主码
带子查询的修改语句
关系数据库管理系统在执行修改语句时会检查修改操作是否破坏表上已定义的完整性规则
- 实体完整性
- 主码不允许修改
- 用户定义的完整性
- NOT NULL约束
- UNIQUE约束
- 域值约束
删除数据
语句格式
DELETE
FROM <表名>
[WHERE <条件>];
功能:删除指定表中满足WHERE子句条件的元组
WHERE子句:
- 指定要删除的元组
- 缺省表示要删除表中全部元组,表的定义仍在字典中
三种删除方式:
- 删除某一元组的值
- 删除多个元组的值
- 带子查询的删除语句
空值的处理
空值就是“不知道”或“不存在”或“无意义”的值。
空值的一般情况:
- 该属性应该有一个值,但目前不知道它的具体值
- 该属性不应该有值
- 由于某种原因不便于填写
空值的产生
空值是一个很特殊的值,含有不确定性。对关系运算带来特殊的问题,需要做特殊的处理。
空值的产生
空值的判断
判断一个属性的值是否为空值,用IS NULL或IS NOT NULL来表示
空值的约束条件
属性定义中:
- 有NOT NULL约束条件的不能取空值
- 加了UNIQUE限制的属性不能取空值
- 码属性不能取空值
空值的算术运算、比较运算和逻辑运算
空值与另一个值的算数运算结果为空值
空值与另一个值的比较运算结果为UNKNOWN
有UNKNOWN后,传统二值(TRUE,FALSE)逻辑就扩展成了三值逻辑
查询结果不包括Grade的值为null的,如果需要查找到包括的需要添加条件(Grade IS NULL)
视图
视图的特点:
- 虚表,是从一个或几个基本表导出的表
- 只存放视图的定义,不存放视图对应的数据
- 基表中的数据发生变哈uv,从视图中查询出的数据也随之改变
定义视图
建立视图
语句格式
CREATE VIEW
<视图名>[(<列名>[,<列名>]...)]
AS <子查询>
[WITH CHECK OPTION];
WITH CHECK OPTION
对视图进行UPDATE,INSERT和DELETE操作时要保证更新,插入或删除的行满足视图定义中的谓词条件(即子查询中的条件表达式)
子查询可以是任意的SELECT语句,是否可以含有ORDER BY子句和DISTINCT短语,则决定具体系统的实现
组成视图的属性列名:全部省略或全部指定
- 全部省略
- 由子查询中SELECT目标列中的诸字段组成
- 明确指定视图的所有列名
- 某个目标列是聚集函数或列表达式
- 多表连接时选出了几个同名列作为视图的字段
- 需要在视图中为某个列启用新的更合适的名字
关系数据库管理系统执行CREATE VIEW语句时只是把视图定义存入数据字典,并不执行其中的SELECT语句
在对视图查询时,按视图的定义从基本表中将数据查出
新建基于单表的视图
定义is_student视图时加上WITH CHECK OPTION子句,对该视图进行插入,修改和删除操作时,RDBMS会自动加上Sdept = 'IS'的条件
若一个视图是从单个基本表导出的,并且只是去掉了基本表的某些行和列,但保留了主码,我们称这类视图为行列子集视图
新建基于多表的视图
新建基于视图的视图
新建带表达式的视图
新建分组视图
如果SELECT后面不指定属性列,即填写为*,则表与视图之间的映像关系被破坏,该视图不能正确工作
删除视图
语句格式
DROP VIEW <视图名>[CASCADE];
该语句从数据字典中删除指定的视图定义
如果该视图上还导出了其他视图,使用CASCADE级联删除语句,把该视图和由它导出的所有的视图一起删除
删除基表是,由该基表导出的所有视图定义都必须显示地使用DROP VIEW语句删除
查询视图
用户角度:查询视图和查询基本表相同
关系数据库管理系统实现视图查询的方法——视图消解法
- 进行有效性检查
- 转换成等价的对基本表的查询
- 执行修正后的查询
视图消解转换后的查询语句可以为
视图消解法的局限
有些情况下,视图消解法不能生成正确查询
更新视图
更新视图的限制:一些视图是不可更新的,因为对这些视图的更新不能唯一地有意义地转换成对相应基本表的更新
允许对行列子集视图进行更新
对其他类型视图的更新不同系统有不同限制
DB2对视图更新的限制:
- 若视图是由两个以上基本表到处的,则此视图不允许更新
- 若视图的字段来自字段表达式或常数,则不允许对此视图执行INSERT和UPDATE操作,但允许执行DELETE操作
- 若视图的字段来自集函数,则此视图不允许更新
- 若视图定义中含有GROUP BY子句,则此视图不允许更新
- 若视图定义中含有DISTINCT短语,则此视图不允许更新
- 若视图定义中有嵌套查询,并且内层查询的FROM子句中涉及的表也是导出该视图的基本表,则此视图不允许更新
- 一个不允许更新的视图上定义的视图也不允许更新
视图的作用
视图能够简化用户的操作
- 当视图中数据不是直接来自基本表时,定义视图能够简化用户操作
- 基于多张表连接形成的视图
- 基于复杂嵌套查询的视图
- 含导出属性的视图
视图使用户能以多种角度看待同一数据
- 视图机制能使不同用户以不同方式看待同一数据,适应数据库共享的需要
视图对重构数据库提供了一定程度的逻辑独立性
- 数据库重构——使用户的外模式保持不变,用户的应用程序通过视图仍然能够查找数据
- 由于对视图的更新是有条件的,因此应用程序中修改数据的语句可能仍会因基本表结构的改变而改变
视图能够对机密数据提供安全保护
- 对不同用户定义不同视图,使每个用户只能看到他有权看到的数据
适当的利用视图可以更清晰的表达查询
- 经常需要执行某个样式的查询,可以先定义一个视图