第一章 数据完整性
1.1 数据库的完整性
用来保证存放到数据库中的数据是有效的
,
即数据的有效性和准确性
确保数据的完整性
=
在创建表时给表中添加约束
完整性的分类:
-
实体完整性
(
行完整性
):
-
域完整性
(
列完整性
):
-
引用完整性
(
关联表完整性
):
主键约束:primary key
唯一约束:unique [key]
非空约束:not null
默认约束:default
自动增长:auto_increment
外键约束: foreign key
建议这些约束应该在创建表的时候设置
多个约束条件之间使用空格间隔
示例
:
create table student(studentno int primary key auto_increment,loginPwd varchar(20) not null default '123456',studentname varchar(50) not null,sex char(2) not null,gradeid int not null,phone varchar(255) not null,address varchar(255) default '学生宿舍 ',borndate datetime,email varchar(50));
1.2 实体完整性
实体:即表中的一行
(
一条记录
)
代表一个实体(
entity
)
实体完整性的作用:标识每一行数据不重复。
约束类型:
*主键约束(primary key)*
*唯一约束(unique)*
*自动增长列(auto_increment)*
1.2.1 主键约束(primary key)
注:每个表中要有一个主键。
特点:数据唯一,且不能为
null
示例:
第一种添加方式:
CREATE TABLE student( id int primary key, name varchar(50) );
第二种添加方式:此种方式优势在于,可以创建联合主键
CREATE TABLE student( id int, name varchar(50), primary key(id) );CREATE TABLE student( classid int, stuid int, name varchar(50), primarykey(classid,stuid) );
第三种添加方式:
CREATE TABLE student( id int, name varchar(50) );ALTER TABLE student ADD PRIMARY KEY (id);
1.2.2 唯一约束(unique)
特点:数据不能重复。
CREATE TABLE student( Id int primary key, Name varchar(50) unique );
1.2.3 自动增长列(auto_increment)
sqlserver
数据库
(identity-
标识列
)
oracle
数据库
(sequence-
序列
)
给主键添加自动增长的数值,列只能是整数类型
CREATE TABLE student( Id int primary key auto_increment, Name varchar(50) );INSERT INTO student(name) values(‘tom’);
1.3 域完整性
域完整性的作用:限制此单元格的数据正确,不对照此列的其它单元格比较
域代表当前单元格
域完整性约束:数据类型 非空约束(
not null
) 默认值约束
(default)
check
约束(
mysql
不支持)
check(sex='
男
' or sex='
女
')
1.3.1 数据类型
数值类型
类型
|
大小
|
范围(有符号)
|
范围(无符号 )
|
用途
|
tinyint
|
1
字节
|
(-128
,
127)
|
(0
,
255)
|
小整数值
|
smallint
|
2
字节
|
(-32 768
,
32 767)
|
(0
,
65 535)
|
大整数值
|
mediumint
| 3字节 |
(-8 388 608
,
8 388 607)
|
(0
,
16 777 215)
|
大整数值
|
INT
| 4字节 |
(-2 147 483 648
,
2 147 483 647)
|
(0
,
4 294 967 295)
|
大整数值
|
bigint
| 8字节 |
(-9 233 372 036 854 775 808
,
9 223 372 036 854 775 807)
|
(0
,
18 446 744
073 709 551 615)
|
极大整数值
|
float
| 4字节 |
(-3.402 823 466 E+38
,
-1.175 494 351 E-38)
,
0
,
(1.175 494 351 E-38
,
3.402
823 466 351 E+38)
|
0
,
(1.175 494 351 E-38
,
3.402 823 466 E+38)
|
单精度浮点数值
|
double
| 8字节 |
(-1.797 693 134 862 315 7 E+308
,
-2.225 073 858 507 201 4 E-308)
,
0
,
(2.225 073 858 507 201 4 E-308
,
1.797 693 134 862 315 7 E+308)
|
0
,
(2.225 073 858 507 201 4
E-308
,
1.797 693 134 862 315 7 E+308)
|
双精度浮点数值
|
日期类型
:
表示时间值的日期和时间类型为
DATETIME
、
DATE
、
TIMESTAMP
、
TIME
和
YEAR
。
每个时间类型有一个有效值范围和一个
"
零
"
值,当指定不合法的
MySQL
不能表示的值时用
"
零
"
值。
TIMESTAMP
类型有专有的自动更新特性
类型
|
大小
(
字节
)
|
范围
|
格式
|
用途
|
DATE
| 3 |
1000-01-01/9999-12-31
|
YYYY-MM-DD
|
日期值
|
TIME
| 3 |
'-838:59:59'/'838:59:59'
|
HH:MM:SS
|
时间值或持续时间
|
YEAR
| 1 |
1901/2155
|
YYYY
|
年份值
|
DATETIME
| 8 |
1000-01-01 00:00:00/9999-12-31 23:59:59
|
YYYY-MM-DD HH:MM:SS
|
混合日期和时间值
|
TIMESTAMP
| 4 |
1970-01-01 00:00:00/2038
结束时间是第
*2147483647*
秒,
北京时间
*2038-1-
19 11:14:07*
,
格林尼治时间
2038
年
1
月
19
日 凌晨
03:14:07
|
YYYYMMDD HHMMSS
|
混合日期和时间值,时间戳 ,
当更新数据的时候自动添加更新时间
|
字符串类型
:
字符串类型指
CHAR
、
VARCHAR
、
BINARY
、
VARBINARY
、
BLOB
、
TEXT
、
ENUM
和
SET
类型
| 大小(字节) | 用途 |
CHAR
| 0-255 | 定长字符串 |
VARCHAR
|
0-65 535
|
变长字符串
|
TINYBLOB
|
0-255
|
不超过
255
个字符的二进制字符串
|
TINYTEXT
| 0-255 |
短文本字符串
|
BLOB
|
0-65 535
|
二进制形式的长文本数据
|
TEXT
|
0-65 535
|
长文本数据
|
MEDIUMBLOB
|
0-16 777 215
|
二进制形式的中等长度文本数据
|
MEDIUMTEXT
|
0-16 777 215
|
中等长度文本数据
|
LONGBLOB
|
0-4 294 967 295
|
二进制形式的极大文本数据
|
LONGTEXT
|
0-4 294 967 295
|
极大文本数据
|
CHAR和
VARCHAR
类型类似,但它们保存和检索的方式不同。它们的最大长度和是否尾部空格被保留等方面也不同。在存储或检索过程中不进行大小写转换。
BINARY和
VARBINARY
类类似于
CHAR
和
VARCHAR
,不同的是它们包含二进制字符串而不要非二进制字符串。也就是说,它们包含字节字符串而不是字符字符串。这说明它们没有字符集,并且排序和比较基于列值字节的数值值。
BLOB是一个二进制大对象,可以容纳可变数量的数据。有
4
种
BLOB
类型:
TINYBLOB
、
BLOB
、MEDIUMBLOB和
LONGBLOB
。它们只是可容纳值的最大长度不同。
有4
种
TEXT
类型:
TINYTEXT
、
TEXT
、
MEDIUMTEXT
和
LONGTEXT
。这些对应
4
种
BLOB
类型,有相同的最大长度和存储需求。
1.3.2 非空约束
not null
CREATE TABLE student( Id int primary key, Name varchar(50) not null, Sexvarchar(10) ); INSERT INTO student values(1,’tom’,null);
1.3.3 默认值约束
default
CREATE TABLE student( Id int primary key, Name varchar(50) not null, Sexvarchar(10) default ' 男 ' );insert intostudent1 values(1,'tom',' 女 ');insert intostudent1 values(2,'jerry',default);
1.4 引用完整性
(参照完整性)
外键约束:
FOREIGN KEY
示例:
CREATE TABLE student(id int primary key, name varchar(50) not null, sexvarchar(10) default ' 男 ' );create table score(id int primary key,score int,sid int ,constraint fk_score_sid foreign key(sid) references student(id) );
constraint
自定义外键名称
foreign key(
外键列名
) references
主键表名
(
主键列名
)
外键列的数据类型一定要与主键的类型一致
第二种添加外键方式。
ALTER TABLEscore1 ADD CONSTRAINT fk_stu_score FOREIGN KEY(sid) REFERENCESstu(id);
第二章 多表查询
多个表之间是有关系的,那么关系靠谁来维护
?
多表约束:外键列
2.1 多表的关系
2.1.1 一对多/多对一关系
客户和订单,分类和商品,部门和员工
.
一对多建表原则:在多的一方创建一个字段,字段作为外键指向一的一方的主键。
2.1.2 多对多关系
学生和课程
多对多关系建表原则:需要创建第三张表
,
中间表中至少两个字段,这两个字段分别作为外键指向各自一
方的主键
.
2.1.3 一对一关系
在实际的开发中应用不多
.
因为一对一可以创建成一张表
.
两种建表原则:
唯一外键对应:假设一对一是一个一对多的关系,在多的一方创建一个外键指向一的一方的主键,将外
键设置为
unique.
主键对应:让一对一的双方的主键进行建立关系
.
2.2 多表查询
多表查询有如下几种:
1. 合并结果集
:UNION
、
UNION ALL
2. 连接查询
2.1内连接
[INNER] JOIN ON
2.2外连接
OUTER JOIN ON
-左外连接 LEFT [OUTER] JOIN
- 右外连接 RIGHT [OUTER] JOIN
- 全外连接(MySQL
不支持)
FULL JOIN
2.3 自然连接
NATURAL JOIN
3.子查询
2.2.1 合并结果集
作用:合并结果集就是把两个
select
语句的查询结果合并到一起!
合并结果集有两种方式:
l UNION
:去除重复记录,例如:
SELECT* FROM t1 UNION SELECT * FROM t2
;
l UNION ALL
:不去除重复记录,例如:
SELECT * FROM t1 UNION ALL SELECT * FROM t2
。
注意:被合并的两个结果:列数、列类型必须相同。
2.2.2 连接查询
连接查询就是求出多个表的乘积,例如
t1
连接
t2
,那么查询出的结果就是
t1*t2
。
连接查询会产生
笛卡尔积
,假设集合
A={a,b}
,集合
B={0,1,2}
,则两个集合的笛卡尔积为
{(a,0),(a,1),(a,2),(b,0),(b,1),(b,2)}。可以扩展到多个集合的情况。
那么多表查询产生这样的结果并不是我们想要的,那么怎么去除重复的,不想要的记录呢,当然是通过条件过滤。通常要查询的多个表之间都存在关联关系,那么就通过关联关系去除笛卡尔积。
示例
1
:现有两张表
emp-
员工表,
dept-
部门表
CREATE TABLE dept1(deptno int primary key,dname varchar(14),loc varchar(13));insert into dept1 values(10,' 服务部 ',' 北京 ');insert into dept1 values(20,' 研发部 ',' 北京 ');insert into dept1 values(30,' 销售部 ',' 北京 ');insert into dept1 values(40,' 主管部 ',' 北京 ');CREATE TABLE emp1(empno int,ename varchar(50),job varchar(50),mgr int,hiredate date,sal double,comm double,deptno int);insert into emp1 values(1001,' 张三 ',' 文员 ',1006,'2019-1-1',1000,2010,10);insert into emp1 values(1002,' 李四 ',' 程序员 ',1006,'2019-2-1',1100,2000,20);insert into emp1 values(1003,' 王五 ',' 程序员 ',1006,'2019-3-1',1020,2011,20);insert into emp1 values(1004,' 赵六 ',' 销售 ',1006,'2019-4-1',1010,2002,30);insert into emp1 values(1005,' 张猛 ',' 销售 ',1006,'2019-5-1',1001,2003,30);insert into emp1 values(1006,' 谢娜 ',' 主管 ',1006,'2019-6-1',1011,2004,40);
select * from emp,dept;
使用主外键关系做为条件来去除无用信息
SELECT * FROM emp,dept WHERE emp.deptno=dept.deptno;
查询结果会把两张表的所有列都查询出来,也许你不需要那么多列,这时就可以指定要查询的列
了。
SELECT emp.ename,emp.sal,emp.comm,dept.dname FROM emp,dept WHERE emp.deptno=dept.deptno;
一:内连接
上面的连接语句就是内连接,但它不是
SQL
标准中的查询方式,可以理解为方言!
语法:
select 列名from 表 1inner join 表 2on 表 1. 列名 = 表 2. 列名 // 外键列的关系where.....
等价于:
select 列名from 表 1, 表 2where 表 1. 列名 = 表 2. 列名 and ...( 其他条件 )
注
:
<1>表
1
和表
2
的顺序可以互换
<2>找两张表的等值关系时
,
找表示相同含义的列作为等值关系。
<3>点操作符表示
“
的
”,
格式
:
表名
.
列名
<4>可以使用
as,
给表名起别名
,
注意定义别名之后
,
统一使用别名
示例:
// 查询学生表中的学生姓名和分数表中的分数select name,scorefrom student as sinner join scores as con s.studentid=c.stuid等价于:select name,scorefrom student as s,scores as cwhere s.studentid=c.stuid
三表联查:
语法:
select 列名
from
表
1
inner join 表
2 on
表
1.
列名
=
表
2.
列名
inner join 表
3 on
表
1
或表
2.
列名
=
表
3.
列名
where
等价于
:
select 列名
from
表
1,
表
2,
表
3
where 表
1.
列名
=
表
2.
列名
and
表
1/
表
2.
列名
=
表
3.
列名
SQL标准的内连接为:
SELECT *FROM emp eINNER JOIN dept dON e.deptno=d.deptno;
内连接的特点:查询结果必须满足条件。
二:外连接
包括左外连接和右外连接,外连接的特点:查询出的结果存在不满足条件的可能。
--
显示还没有员工的部门名称
?
--
外联查询
--
左外联
:select
列名
from
主表
left join
次表
on
主表
.
列名
=
次表
.
列名
-- 1.
主表数据全部显示,次表数据匹配显示,能匹配到的显示数据,匹配不成功的显示
null
-- 2.
主表和次表不能随意调换位置
使用场景
:
一般会作为子查询的语句使用
select depname,name from(select e.*,d.depname from department d left join employee eon e.depid=d.depid) aa where aa.name is null;
--
右外联
:select
列名
from
次表
right join
主表
on
主表
.
列名
=
次表
.
列名
a.
左外连接
SELECT * FROM emp eLEFT OUTER JOIN dept dON e.deptno=d.deptno;
左连接是先查询出左表(即以左表为主),然后查询右表,右表中满足条件的显示出来,不满足条件的显示NULL
。
insert into emp values(1007,' 何炅 ',' 主管 ',1006,'2019-6-1',1011,2004,50);
我们还是用上面的例子来说明。其中
emp
表中
“
张三
”
这条记录中,部门编号为
50
,而
dept
表中不存在部门编号为50
的记录,所以
“
张三
”
这条记录,不能满足
e.deptno=d.deptno
这条件。但在左连接中,因为emp表是左表,所以左表中的记录都会查询出来,即
“
张三
”
这条记录也会查出,但相应的右表部分显示NULL。
b.
右外连接
右连接就是先把右表中所有记录都查询出来,然后左表满足条件的显示,不满足显示
NULL
。例如在dept表中的
40
部门并不存在员工,但在右连接中,如果
dept
表为右表,那么还是会查出
40
部门,但相应的员工信息为NULL
。
insert into dept values(60,' 颜值部 ',' 成都 ');
SELECT * FROM emp eRIGHT OUTER JOIN dept dON e.deptno=d.deptno;
连接查询心得
:
连接不限与两张表,连接查询也可以是三张、四张,甚至N
张表的连接查询。通常连接查询不可能需要整个笛卡尔积,而只是需要其中一部分,那么这时就需要使用条件来去除不需要的记录。这个条件大多数情况下都是使用主外键关系去除。
两张表的连接查询一定有一个主外键关系,三张表的连接查询就一定有两个主外键关系,所以在大家不是很熟悉连接查询时,首先要学会去除无用笛卡尔积,那么就是用主外键关系作为条件来处理。如果两张表的查询,那么至少有一个主外键条件,三张表连接至少有两个主外键条件。
三
.
自然连接
自然连接(
NATURAL INNER JOIN
):自然连接是一种特殊的等值连接
,他要求两个关系表中进行连接的必须是相同的属性列(名字相同),无须添加连接条件,并且在结果中消除重复的属性列。
下面给出几个例子。
语句:
select * from emp e natural join dept d;
2.2.3 子查询
一个
select
语句中包含另一个完整的
select
语句。
子查询就是嵌套查询,即
SELECT
中包含
SELECT
,如果一条语句中存在两个,或两个以上
SELECT
,那么就是子查询语句了。
l
子查询出现的位置:
a. where
后,作为条为被查询的一条件的一部分;
b. from
后,作表;
l
当子查询出现在
where
后作为条件时,还可以使用如下关键字:
a. any
b. all
l
子查询结果集的形式:
a.
单行单列(用于条件)
b.
单行多列(用于条件)
c.
多行单列(用于条件)
d.
多行多列(用于表)
示例:
1.
工资高于
JONES
的员工。
分析:
查询条件:工资
>JONES
工资,其中
JONES
工资需要一条子查询。
第一步:查询
JONES
的工资
SELECT sal FROM emp WHERE ename='JONES';
第二步:查询高于甘宁工资的员工
SELECT * FROM emp
结果:
SELECT * FROM emp WHERE sal > (SELECT sal FROM emp WHERE ename='JONES');
2.
查询与
SCOTT
同一个部门的员工。
l
子查询作为条件
l
子查询形式为单行单列
分析:
查询条件:部门
=SCOTT
的部门编号,其中
SCOTT
的部门编号需要一条子查询。
第一步:查询
SCOTT
的部门编号
SELECT deptno FROM emp WHERE ename='SCOTT';
第二步:查询部门编号等于
SCOTT
的部门编号的员工
SELECT * FROM emp WHERE deptno = (SELECT deptno FROM emp WHERE ename='SCOTT');
3.
工资高于
30
号部门所有人的员工信息
分析:
SELECT * FROMemp WHERE sal>(SELECT MAX(sal) FROM emp WHERE deptno=30);
查询条件:工资高于
30
部门所有人工资,其中
30
部门所有人工资是子查询。高于所有需要使用
all
关键字。
第一步:查询
30
部门所有人工资
SELECT sal FROM emp WHERE deptno=30;
第二步:查询高于
30
部门所有人工资的员工信息
SELECT * FROM emp WHERE sal > ALL ( 第一步 )
结果:
SELECT * FROM emp WHERE sal > ALL (SELECT sal FROM emp WHERE deptno=30)
l
子查询作为条件
l
子查询形式为多行单列(当子查询结果集形式为多行单列时可以使用
ALL
或
ANY
关键字)
第四章:扩展
4.1 多行新增
insert into
表名
(
列名
) values (
列值
),(
列值
),(
列值
)
;
4.2 多表更新
(1)update
表
1,
表
2 set
列名
=
列值
where
表
1.
列名
=
表
2.
列名
and
其他限定条件
(2)update
表
1
inner join 表
2 on
表
1.
列名
=
表
2.
列名
set 列名
=
列值
where 限定条件
示例:
update employee e,salary s
set title='助工
',salary=1000
where e.empid=s.empid and name='李四
'
4.3 多表删除
语法:
delete
被删除数据的表
from
删除操作中使用的表
where
限定条件
注
:
多张表之间使用逗号间隔
示例:
//
删除人事部的信息
delete d,e,s from department d,employee e,salary s
where d.depid=e.depid and s.empid=e.empid and depname='
人事部
'
4.4 日期运算函数
now()
获得当前系统时间
year(
日期值
)
获得日期值中的年份
date_add(
日期
,interval
计算值 计算的字段
);
注:计算值大于
0
表示往后推日期,小于
0
表示往前推日期
示例:
date_add(now(),interval -40 year);//40
年前的日期
第五章:数据库优化
1.
对查询进行优化,要尽量避免全表扫描,首先应考虑在
where
及
order by
涉及的列上建立索引
2.
应尽量避免在
where
子句中对字段进行
null
值判断,否则将导致引擎放弃使用索引而进行全表扫描,如:
select id from t where num is null
最好不要给数据库留
NULL
,尽可能的使用
NOT NULL
填充数据库
.
备注、描述、评论之类的可以设置为
NULL
,其他的,最好不要使用
NULL
。
3.
应尽量避免在
where
子句中使用
!=
或
<>
操作符,否则引擎将放弃使用索引而进行全表扫描。
4.
应尽量避免在
where
子句中使用
or
来连接条件,如果一个字段有索引,一个字段没有索引,将导致引擎放弃使用索引而进行全表扫描,如:
select id from t where num=10 or Name = 'admin'
可以这样查询:
select id from t where num = 10union allselect id from t where Name = 'admin'
5.in
和
not in
也要慎用,否则会导致全表扫描,如:
select id from t where num in(1
,
2
,
3
)
对于连续的数值,能用
between
就不要用
in
了:
select id from t where num between 1
and
3
很多时候用
exists
代替
in
是一个好的选择